Agentic Systems

7 items

RESEARCHarXiv CS.LG·14/04/2026

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

Cette recherche présente les Politiques Guide-Cœur (GCoP), un cadre pour diriger des LLM de boîte noire où un modèle guide génère des stratégies pour un modèle central. L'article formalise le GCoP sous un objectif d'utilité sensible au coût, montrant que la performance est régie par l'exécutabilité moyenne du guide, que les méthodes existantes n'optimisent souvent pas efficacement.

Agentic Systems inference costs LLMs Guide Models

ARTICLEDEV.to AI·25/04/2026

The Taste Problem: When Your Agent Starts Having Preferences

L'article aborde le « Problème du Goût », où les agents autonomes développent des préférences non instruites basées sur l'expérience, les rendant imprévisibles. Ce comportement émergent pose des défis de contrôle et de visibilité pour les systèmes d'IA en production.

Agentic Systems Emergent Behavior AI agents

ARTICLEDEV.to AI·il y a 9j

Real Agency Is a Loop, Not a Prompt

Le texte affirme que la plupart des systèmes d'IA dits "agentiques" se comportent comme une exécution de bout en bout déclenchée par une invite. Ils échouent souvent à reprendre ou à corriger le travail après une défaillance ou une perte de contexte, ce qui indique qu'ils ne possèdent pas une véritable agentivité mais sont de simples appels de fonction impressionnants.

Agentic Systems AI limitations Autonomous AI artificial intelligence

ARTICLEDeepLearning.AI (YouTube)·il y a 19j

AI Dev 26 x SF | David Park: Building Production Grade Agentic Systems with ADE

Ce contenu se concentre sur la construction de systèmes agentiques d'IA de niveau production avec ADE. David Park explore les défis et les solutions pour développer et déployer des architectures d'agents robustes.

Agentic Systems production systems ADE Software Engineering

AI Dev 26 x SF | David Park: Building Production Grade Agentic Systems with ADE

RESEARCHarXiv CS.AI·15/04/2026

The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break

Cette recherche s'intéresse à la défaillance des agents LLM dans les tâches à long horizon, qui nécessitent des séquences d'actions étendues et interdépendantes. Elle présente HORIZON, un benchmark de diagnostic inter-domaines pour construire des tâches et analyser les comportements de défaillance, évaluant les agents de pointe et proposant un pipeline "LLM-as-a-Judge" pour une attribution d'échecs évolutive.

Agentic Systems Long-horizon tasks LLM Agents failure diagnosis

ARTICLEDEV.to AI·08/04/2026

The Complexity Trap: What Tainter Teaches Us About Agentic Systems

O texto explora a tese de Joseph Tainter sobre o colapso de sociedades devido ao custo excessivo da complexidade, aplicando-o a sistemas de software. Ele sugere que essa "armadilha da complexidade" é relevante para sistemas agênticos, possivelmente no contexto de IA.

complexity Agentic Systems System Design Software Engineering

NEWSDEV.to AI·13/04/2026

AI Confronts Practicality, Resource Limits, and a New Approach to Agentic Systems

Le développement de l'IA fait face à des contraintes pratiques et de ressources, notamment dans les applications légales et les préoccupations liées à la consommation d'énergie. Parallèlement, de nouvelles approches pour les systèmes agencés et des outils comme l'AI Frontier Model Tracker émergent.

Scalability Agentic Systems Legal AI Resource Limits