RESEARCH46

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

arXiv CS.AI·27 de abril de 2026

Esta pesquisa enquadra a autocorreção de LLMs como um ciclo de feedback cibernético, usando um modelo de Markov de dois estados para determinar quando o refinamento iterativo ajuda ou prejudica. Ela identifica um limiar crítico de EIR (<= 0,5%) que separa a autocorreção benéfica da prejudicial, mostrando que apenas alguns modelos melhoram, enquanto outros como o GPT-5 degradam.

LLMsself-correctionbenchmarkingAI agents

Ler original ↗