ExecTune: Effective Steering of Black-Box LLMs with Guide Models
Esta investigación introduce las Políticas Guía-Núcleo (GCoP), un marco para dirigir LLMs de caja negra donde un modelo guía genera estrategias para un modelo central. El estudio formaliza GCoP bajo un objetivo de utilidad sensible al costo, destacando que el rendimiento depende de la ejecutabilidad promedio de la guía, la cual los métodos actuales a menudo no logran optimizar.
