← heapsort-ai

self-correction

3 items

RESEARCHarXiv CS.AI·27/04/2026

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

Esta pesquisa enquadra a autocorreção de LLMs como um ciclo de feedback cibernético, usando um modelo de Markov de dois estados para determinar quando o refinamento iterativo ajuda ou prejudica. Ela identifica um limiar crítico de EIR (<= 0,5%) que separa a autocorreção benéfica da prejudicial, mostrando que apenas alguns modelos melhoram, enquanto outros como o GPT-5 degradam.

27