heapsort
RESEARCH27

How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning

arXiv CS.AI·26 de maio de 2026

Este artigo quantifica e explica a redundância no raciocínio de grandes modelos de linguagem (LLMs), formalizando o conceito e medindo-o em larga escala. A pesquisa revela que entre 61% e 93% dos passos de pensamento dos LLMs são desnecessários, impactando latência, uso de GPU e energia.

Ler original