RESEARCHarXiv CS.LG·4/14/2026
ExecTune: Effective Steering of Black-Box LLMs with Guide Models
Diese Forschung stellt Guide-Core Policies (GCoP) vor, ein Framework zur Steuerung von Black-Box-LLMs, bei dem ein Leitmodell Strategien für ein Kernmodell generiert. Die Arbeit formalisiert GCoP unter einem kostensensitiven Nutzenziel und betont, dass die End-to-End-Performance durch die leitmodell-gemittelte Ausführbarkeit bestimmt wird, welche bestehende Methoden oft nicht effektiv optimieren.
28