self-correction

3 items

ARTICLE↑ trendingReddit r/LocalLLaMA·26d atrás

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

Um experimento demonstrou que um pequeno modelo de IA pode se treinar para programar, inventando problemas, resolvendo-os e corrigindo seus próprios erros. O modelo alcançou 80% no HumanEval e superou o GPT-3.5 em matemática, usando apenas um interpretador Python como juiz.

self-correction AI training Benchmarking code generation

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

ARTICLEDEV.to AI·11/04/2026

Introducing HyperFlow: The Framework Where AI Writes Its Own Code!

O conteúdo introduz o HyperFlow, um framework experimental de agentes de IA auto-melhoráveis, construído sobre LangChain e LangGraph. Ele utiliza um TaskAgent para resolver problemas e um MetaAgent que aprende com os erros do primeiro para automatizar melhorias sem intervenção humana.

self-correction frameworks AI agents

RESEARCHarXiv CS.AI·27/04/2026

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

Esta pesquisa enquadra a autocorreção de LLMs como um ciclo de feedback cibernético, usando um modelo de Markov de dois estados para determinar quando o refinamento iterativo ajuda ou prejudica. Ela identifica um limiar crítico de EIR (<= 0,5%) que separa a autocorreção benéfica da prejudicial, mostrando que apenas alguns modelos melhoram, enquanto outros como o GPT-5 degradam.

LLMs self-correction Benchmarking AI agents