redundancy — articles, actualités et recherches IA

RESEARCHarXiv CS.AI·il y a 15j

How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning

Cet article quantifie et explique la redondance dans le raisonnement des grands modèles linguistiques (LLM), en formalisant le concept et en le mesurant à grande échelle. La recherche révèle qu'entre 61% et 93% des étapes de réflexion des LLM sont inutiles, impactant la latence, le temps GPU et la consommation d'énergie.

efficiency Benchmarking Reasoning redundancy