heapsort
RESEARCH28

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

arXiv CS.LG·14 de abril de 2026

Esta pesquisa apresenta as Políticas Guia-Núcleo (GCoP), uma estrutura para direcionar LLMs de caixa-preta onde um modelo guia gera estratégias para um modelo central. O artigo formaliza GCoP sob um objetivo de utilidade sensível ao custo, mostrando que o desempenho é governado pela executabilidade média do guia, que os métodos existentes frequentemente não otimizam.

Ler original