RESEARCH28
ExecTune: Effective Steering of Black-Box LLMs with Guide Models
arXiv CS.LG·14 de abril de 2026
Esta pesquisa apresenta as Políticas Guia-Núcleo (GCoP), uma estrutura para direcionar LLMs de caixa-preta onde um modelo guia gera estratégias para um modelo central. O artigo formaliza GCoP sob um objetivo de utilidade sensível ao custo, mostrando que o desempenho é governado pela executabilidade média do guia, que os métodos existentes frequentemente não otimizam.
Ler original ↗