ARTICLE↑ trending42

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

Reddit r/LocalLLaMA·14 de maio de 2026

Um experimento demonstrou que um pequeno modelo de IA pode se treinar para programar, inventando problemas, resolvendo-os e corrigindo seus próprios erros. O modelo alcançou 80% no HumanEval e superou o GPT-3.5 em matemática, usando apenas um interpretador Python como juiz.

self-correction AI training Benchmarking code generation large language models

Ler original ↗