RESEARCH27
When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention
arXiv CS.AI·27 avril 2026
Cette recherche encadre l'autocorrection des LLM comme une boucle de rétroaction cybernétique, utilisant un modèle de Markov à deux états pour déterminer quand l'affinement itératif est bénéfique ou nuisible. Elle identifie un seuil critique d'EIR (<= 0,5%) séparant l'autocorrection bénéfique de la nuisible, montrant que seuls quelques modèles s'améliorent, tandis que d'autres comme GPT-5 se dégradent.
Lire l'original ↗