RESEARCHarXiv CS.AI·15d atrás
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
Este artigo quantifica e explica a redundância no raciocínio de grandes modelos de linguagem (LLMs), formalizando o conceito e medindo-o em larga escala. A pesquisa revela que entre 61% e 93% dos passos de pensamento dos LLMs são desnecessários, impactando latência, uso de GPU e energia.
27