RESEARCHarXiv CS.AI·hace 6d
Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models
Este artículo evalúa el "exceso de pensamiento perjudicial" en Modelos de Razonamiento Grandes, donde el razonamiento continuo después de una respuesta correcta puede desestabilizar la trayectoria. Introduce un protocolo para diferenciar el exceso de pensamiento redundante del perjudicial, identificando problemas en benchmarks multimodales.
27