ARTICLE↑ trending42
I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math
Reddit r/LocalLLaMA·14 de maio de 2026

Um experimento demonstrou que um pequeno modelo de IA pode se treinar para programar, inventando problemas, resolvendo-os e corrigindo seus próprios erros. O modelo alcançou 80% no HumanEval e superou o GPT-3.5 em matemática, usando apenas um interpretador Python como juiz.
Ler original ↗