redundancy — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.AI·15d atrás

How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning

Este artigo quantifica e explica a redundância no raciocínio de grandes modelos de linguagem (LLMs), formalizando o conceito e medindo-o em larga escala. A pesquisa revela que entre 61% e 93% dos passos de pensamento dos LLMs são desnecessários, impactando latência, uso de GPU e energia.

efficiency Benchmarking Reasoning redundancy