RESEARCH27

How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning

arXiv CS.AI·26 mai 2026

Cet article quantifie et explique la redondance dans le raisonnement des grands modèles linguistiques (LLM), en formalisant le concept et en le mesurant à grande échelle. La recherche révèle qu'entre 61% et 93% des étapes de réflexion des LLM sont inutiles, impactant la latence, le temps GPU et la consommation d'énergie.

efficiency Benchmarking Reasoning redundancy LLM

Lire l'original ↗