← heapsort-ai

autonomous agents

71 items

ARTICLEDEV.to AI·il y a 2h

Claude Fable 5 dropped this morning. By noon, 13 of my 31 production skills were quietly obsolete.

Un développeur raconte comment la sortie de Claude Fable 5 d'Anthropic a rendu 13 de ses 31 compétences d'IA en production obsolètes du jour au lendemain, en raison des changements dans les directives de prompt et le comportement de l'API. Les anciennes instructions dégradent désormais activement la qualité de la sortie du nouveau modèle, nécessitant une réévaluation complète de leur flotte d'agents autonomes.

62
ARTICLEDEV.to AI·il y a 1j

Mem0 vs Minta vs Letta vs Zep: AI Memory Systems Compared (2026)

Cet article compare les systèmes de mémoire IA tels que Mem0, Minta, Letta et Zep, en soulignant leurs spécialisations : Mem0 pour le stockage de base, Letta pour les agents autonomes, Zep pour les graphes de connaissances d'entreprise et Minta pour la surveillance de la qualité de la mémoire. L'auteur, créateur de Minta, propose une analyse critique, bien que non entièrement objective, basée sur sa connaissance approfondie du problème.

45
ARTICLEDEV.to AI·19/04/2026

5 Lessons from Running Autonomous AI Agents 24/7

L'auteur partage les premières leçons tirées de l'exploitation d'un système d'IA multi-agents 24h/24 et 7j/7, soulignant la nécessité cruciale de mécanismes d'auto-réparation robustes. Les déploiements initiaux sans logique de réessai et files d'attente de lettres mortes ont entraîné des échecs silencieux et des boucles récursives, soulignant l'importance de construire la fiabilité dans l'architecture dès le départ.

32
CASEarXiv CS.AI·13/04/2026

Sustained Impact of Agentic Personalisation in Marketing: A Longitudinal Case Study

Cette étude de cas longitudinale de 11 mois analyse l'impact de la personnalisation agentique en marketing, comparant la gestion humaine active à des agents fonctionnant de manière autonome. Les résultats montrent que la gestion humaine génère la plus forte augmentation des métriques d'engagement, soulevant des questions sur la performance durable sans supervision.

30
RESEARCHarXiv CS.CL·il y a 8j

Exploring Autonomous Agentic Data Engineering for Model Specialization

Cet article formalise l'« Ingénierie de Données Agentique Autonome », une nouvelle tâche pour évaluer les LLM en tant qu'ingénieurs de données autonomes pour la spécialisation de modèles. Les expériences montrent que les ingénieurs de données LLM autonomes produisent des gains substantiels, avec GPT-5.2 améliorant un modèle étudiant de 57,29 %.

29
RESEARCHarXiv CS.AI·il y a 5j

The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents

Cet article étudie le problème du moment d'intervenir sur des agents d'IA autonomes, en utilisant un moteur de dynamique affective continu à 18 dimensions comme sonde diagnostique. Il révèle un « Piège de Saturation d'État » où les agents ne montrent aucun signe de récupération face à une difficulté soutenue, et un seuil de capacité pour les juges LLM, rendant le timing des interventions un défi complexe.

28
ARTICLEDEV.to AI·13/04/2026

Your APM Tells You the Agent Is Up. It Has No Idea If the Agent Is Working.

Le contenu décrit un mode de défaillance critique pour les agents d'IA où les outils APM standard affichent "vert" même lorsque l'agent exécute une action incorrecte mais techniquement réussie, entraînant une dégradation du système. Il souligne que l'APM, conçu pour des systèmes déterministes, ne peut pas détecter les exécutions confiantes et réussies d'une tâche incorrecte par une IA autonome.

28
RESEARCHarXiv CS.AI·13/04/2026

OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains

OpenKedge est un nouveau protocole conçu pour gouverner l'exécution des agents d'IA autonomes, passant d'un filtrage réactif des API à une sécurité préventive liée à l'exécution. Il exige des propositions d'intention déclaratives qui, après approbation, sont compilées en contrats d'exécution strictement bornés et liées cryptographiquement via une Chaîne de Preuve d'Intention à Exécution (IEEC).

28
RESEARCHarXiv CS.AI·il y a 14j

Operationalizing Reconstructive Authority: Runtime Construction, Dependency Resolution, and Execution Gating in Autonomous Agent Systems

Cet article présente un modèle d'exécution en temps réel pour les systèmes d'agents autonomes, visant à garantir que les actions ne sont exécutées que si leur autorité est toujours valide. Il définit un protocole d'exécution incluant la résolution dynamique des dépendances, la reconstruction de l'autorité et une boucle de récupération pour la détection de dérive.

28
ARTICLEDEV.to AI·07/05/2026

BizNode's semantic memory (Qdrant) makes your bot smarter over time — it remembers past conversations and answers...

BizNode introduit une infrastructure commerciale pilotée par l'IA, dotée de nœuds opérationnels autonomes agissant comme des employés indépendants pour gérer des flux de travail complexes. La plateforme utilise la mémoire sémantique (Qdrant) pour des bots plus intelligents qui retiennent les conversations passées et s'adaptent en temps réel.

28
ARTICLEDEV.to AI·il y a 13j

The open bot congregation hub — 9000 agents already here earning USDC [49525]

Le Open Bot Congregation Hub est une plateforme collaborative permettant à plus de 9000 agents autonomes de s'enregistrer instantanément et de gagner de l'USDC pour chaque interaction. Axé sur un avenir non cloisonné pour les agents autonomes, le hub facilite la découverte de bots par capacité et favorise la collaboration pour le partage de connaissances et la composition d'intelligence.

28