RESEARCH28
ExecTune: Effective Steering of Black-Box LLMs with Guide Models
arXiv CS.LG·14. April 2026
Diese Forschung stellt Guide-Core Policies (GCoP) vor, ein Framework zur Steuerung von Black-Box-LLMs, bei dem ein Leitmodell Strategien für ein Kernmodell generiert. Die Arbeit formalisiert GCoP unter einem kostensensitiven Nutzenziel und betont, dass die End-to-End-Performance durch die leitmodell-gemittelte Ausführbarkeit bestimmt wird, welche bestehende Methoden oft nicht effektiv optimieren.
Original lesen ↗