heapsort
RESEARCH27

Token Arena: A Continuous Benchmark Unifying Energy and Cognition in AI Inference

arXiv CS.AI·4 mai 2026

TokenArena est introduit comme un benchmark continu qui mesure l'inférence d'IA à la granularité du point de terminaison selon cinq axes principaux. Il synthétise la vitesse de sortie, le temps jusqu'au premier token, le prix, le contexte effectif et la qualité, ainsi que des estimations d'énergie, en composites tels que les joules et les dollars par réponse correcte et la fidélité du point de terminaison.

Lire l'original