RESEARCH27
Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models
arXiv CS.AI·3 juin 2026
Cet article évalue la "surréflexion nuisible" dans les grands modèles de raisonnement, où un raisonnement continu après une réponse correcte peut déstabiliser la trajectoire. Il introduit un protocole pour distinguer la surréflexion verbeuse de la nuisible, identifiant des problèmes dans les benchmarks multimodaux.
Lire l'original ↗