RESEARCH27
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
arXiv CS.AI·26 mai 2026
Cet article quantifie et explique la redondance dans le raisonnement des grands modèles linguistiques (LLM), en formalisant le concept et en le mesurant à grande échelle. La recherche révèle qu'entre 61% et 93% des étapes de réflexion des LLM sont inutiles, impactant la latence, le temps GPU et la consommation d'énergie.
Lire l'original ↗