heapsort
RESEARCH28

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

arXiv CS.LG·14 de abril de 2026

Esta investigación introduce las Políticas Guía-Núcleo (GCoP), un marco para dirigir LLMs de caja negra donde un modelo guía genera estrategias para un modelo central. El estudio formaliza GCoP bajo un objetivo de utilidad sensible al costo, destacando que el rendimiento depende de la ejecutabilidad promedio de la guía, la cual los métodos actuales a menudo no logran optimizar.

Leer original