← heapsort-ai

Agentic Systems

7 items

RESEARCHarXiv CS.LG·14/04/2026

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

Cette recherche présente les Politiques Guide-Cœur (GCoP), un cadre pour diriger des LLM de boîte noire où un modèle guide génère des stratégies pour un modèle central. L'article formalise le GCoP sous un objectif d'utilité sensible au coût, montrant que la performance est régie par l'exécutabilité moyenne du guide, que les méthodes existantes n'optimisent souvent pas efficacement.

28
ARTICLEDEV.to AI·il y a 9j

Real Agency Is a Loop, Not a Prompt

Le texte affirme que la plupart des systèmes d'IA dits "agentiques" se comportent comme une exécution de bout en bout déclenchée par une invite. Ils échouent souvent à reprendre ou à corriger le travail après une défaillance ou une perte de contexte, ce qui indique qu'ils ne possèdent pas une véritable agentivité mais sont de simples appels de fonction impressionnants.

27
RESEARCHarXiv CS.AI·15/04/2026

The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break

Cette recherche s'intéresse à la défaillance des agents LLM dans les tâches à long horizon, qui nécessitent des séquences d'actions étendues et interdépendantes. Elle présente HORIZON, un benchmark de diagnostic inter-domaines pour construire des tâches et analyser les comportements de défaillance, évaluant les agents de pointe et proposant un pipeline "LLM-as-a-Judge" pour une attribution d'échecs évolutive.

27