self-critique — artículos, noticias e investigación de IA

RESEARCHarXiv CS.AI·hace 23d

ICRL: Learning to Internalize Self-Critique with Reinforcement Learning

ICRL propone un nuevo framework para entrenar agentes de modelos de lenguaje grandes para internalizar la autocrítica, convirtiendo la retroalimentación en capacidad de resolución de problemas sin asistencia. Entrena conjuntamente un solucionador y un crítico desde un backbone compartido, recompensando al crítico por una retroalimentación accionable para fomentar la auto-mejora iterativa.

reinforcement learning learning self-critique large language models