← heapsort-ai

Frontier models

2 items

RESEARCHHugging Face Blog·il y a 13j

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

ITBench-AA, le premier benchmark pour les tâches informatiques d'entreprise agencées, révèle que les modèles d'IA frontaliers actuels obtiennent des scores inférieurs à 50%. Cette étude d'Artificial Analysis et d'IBM souligne la nécessité d'avancées significatives dans les modèles pour gérer efficacement les exigences informatiques des entreprises.

27