I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math
Un experimento demostró que un pequeño modelo de IA puede entrenarse a sí mismo para programar, inventando problemas, resolviéndolos y afinando sus propias correcciones. El modelo alcanzó el 80% en HumanEval y superó a GPT-3.5 en matemáticas, utilizando solo un intérprete de Python como juez.
