self-correction

3 items

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 26d

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

Un experimento demostró que un pequeño modelo de IA puede entrenarse a sí mismo para programar, inventando problemas, resolviéndolos y afinando sus propias correcciones. El modelo alcanzó el 80% en HumanEval y superó a GPT-3.5 en matemáticas, utilizando solo un intérprete de Python como juez.

self-correction AI training Benchmarking code generation

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

ARTICLEDEV.to AI·11/4/2026

Introducing HyperFlow: The Framework Where AI Writes Its Own Code!

HyperFlow es un framework experimental de agentes de IA auto-mejorables, construido sobre LangChain y LangGraph. Utiliza un TaskAgent para resolver problemas y un MetaAgent que aprende de los errores para automatizar mejoras sin intervención humana.

self-correction frameworks AI agents

RESEARCHarXiv CS.AI·27/4/2026

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

Esta investigación enmarca la autocorrección de LLMs como un ciclo de retroalimentación cibernética, utilizando un modelo de Markov de dos estados para determinar cuándo el refinamiento iterativo ayuda o perjudica. Identifica un umbral crítico de EIR (<= 0,5%) que separa la autocorrección beneficiosa de la perjudicial, mostrando que solo algunos modelos mejoran, mientras que otros como GPT-5 se degradan.

LLMs self-correction Benchmarking AI agents