self-critique — KI-Artikel, Nachrichten & Forschung

RESEARCHarXiv CS.AI·vor 23T

ICRL: Learning to Internalize Self-Critique with Reinforcement Learning

ICRL schlägt ein neuartiges Framework vor, um große Sprachmodellagenten zu trainieren, Selbstkritik zu internalisieren und Feedback in unassistierte Problemlösungsfähigkeiten umzuwandeln. Es trainiert gemeinsam einen Solver und einen Kritiker aus einem gemeinsamen Backbone und belohnt den Kritiker für umsetzbares Feedback, um iterative Selbstverbesserung zu fördern.

reinforcement learning learning self-critique large language models