← heapsort-ai

Agentic Systems

7 items

RESEARCHarXiv CS.LG·4/14/2026

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

Diese Forschung stellt Guide-Core Policies (GCoP) vor, ein Framework zur Steuerung von Black-Box-LLMs, bei dem ein Leitmodell Strategien für ein Kernmodell generiert. Die Arbeit formalisiert GCoP unter einem kostensensitiven Nutzenziel und betont, dass die End-to-End-Performance durch die leitmodell-gemittelte Ausführbarkeit bestimmt wird, welche bestehende Methoden oft nicht effektiv optimieren.

28
ARTICLEDEV.to AI·vor 9T

Real Agency Is a Loop, Not a Prompt

Der Text argumentiert, dass das meiste, was als „agentische“ KI bezeichnet wird, immer noch wie eine End-to-End-Ausführung funktioniert, die durch eine Aufforderung ausgelöst wird. Diese Systeme brechen oft nach einem Fehler oder Kontextverlust ab und kehren nicht zurück, was darauf hindeutet, dass sie lediglich beeindruckende Funktionsaufrufe und keine echte Agentur sind.

27
RESEARCHarXiv CS.AI·4/15/2026

The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break

Diese Forschung befasst sich mit dem Versagen von LLM-Agenten bei Aufgaben mit langem Zeithorizont, die erweiterte, voneinander abhängige Handlungssequenzen erfordern. Sie stellt HORIZON vor, einen domänenübergreifenden diagnostischen Benchmark, der darauf ausgelegt ist, Aufgaben systematisch zu konstruieren und Fehlerverhalten zu analysieren, modernste Agenten zu bewerten und eine LLM-als-Richter-Pipeline für skalierbare Fehlerzuweisung vorzuschlagen.

27