RESEARCH27

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

arXiv CS.AI·27 avril 2026

Cette recherche encadre l'autocorrection des LLM comme une boucle de rétroaction cybernétique, utilisant un modèle de Markov à deux états pour déterminer quand l'affinement itératif est bénéfique ou nuisible. Elle identifie un seuil critique d'EIR (<= 0,5%) séparant l'autocorrection bénéfique de la nuisible, montrant que seuls quelques modèles s'améliorent, tandis que d'autres comme GPT-5 se dégradent.

LLMs self-correction Benchmarking AI agents

Lire l'original ↗