heapsort
RESEARCH27

Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models

arXiv CS.AI·3 juin 2026

Cet article évalue la "surréflexion nuisible" dans les grands modèles de raisonnement, où un raisonnement continu après une réponse correcte peut déstabiliser la trajectoire. Il introduit un protocole pour distinguer la surréflexion verbeuse de la nuisible, identifiant des problèmes dans les benchmarks multimodaux.

Lire l'original