RESEARCH27
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
arXiv CS.AI·26 de mayo de 2026
Este artículo cuantifica y explica la redundancia en el razonamiento de los grandes modelos de lenguaje (LLM), formalizando el concepto y midiéndolo a gran escala. La investigación revela que entre el 61% y el 93% de los pasos de pensamiento de los LLM son innecesarios, afectando la latencia, el tiempo de GPU y el consumo de energía.
Leer original ↗