RESEARCH27
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
arXiv CS.AI·26 de maio de 2026
Este artigo quantifica e explica a redundância no raciocínio de grandes modelos de linguagem (LLMs), formalizando o conceito e medindo-o em larga escala. A pesquisa revela que entre 61% e 93% dos passos de pensamento dos LLMs são desnecessários, impactando latência, uso de GPU e energia.
Ler original ↗