RESEARCHarXiv CS.AI·il y a 15j
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
Cet article quantifie et explique la redondance dans le raisonnement des grands modèles linguistiques (LLM), en formalisant le concept et en le mesurant à grande échelle. La recherche révèle qu'entre 61% et 93% des étapes de réflexion des LLM sont inutiles, impactant la latence, le temps GPU et la consommation d'énergie.
27