RESEARCH27

How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning

arXiv CS.AI·26 de mayo de 2026

Este artículo cuantifica y explica la redundancia en el razonamiento de los grandes modelos de lenguaje (LLM), formalizando el concepto y midiéndolo a gran escala. La investigación revela que entre el 61% y el 93% de los pasos de pensamiento de los LLM son innecesarios, afectando la latencia, el tiempo de GPU y el consumo de energía.

efficiency benchmarking Reasoning redundancy LLM

Leer original ↗