RESEARCH27

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

arXiv CS.AI·27 de abril de 2026

Esta investigación enmarca la autocorrección de LLMs como un ciclo de retroalimentación cibernética, utilizando un modelo de Markov de dos estados para determinar cuándo el refinamiento iterativo ayuda o perjudica. Identifica un umbral crítico de EIR (<= 0,5%) que separa la autocorrección beneficiosa de la perjudicial, mostrando que solo algunos modelos mejoran, mientras que otros como GPT-5 se degradan.

LLMs self-correction benchmarking AI agents

Leer original ↗