RESEARCHarXiv CS.AI·6d atrás
Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models
Este artigo avalia o "overthinking prejudicial" em Modelos de Raciocínio Grandes, onde o raciocínio contínuo após uma resposta correta pode desestabilizar a trajetória. Introduz um protocolo para diferenciar o overthinking redundante do prejudicial, identificando problemas em benchmarks multimodais.
27