memory management

25 items

ARTICLEDEV.to AI·il y a 2j

Ephemeral State vs. Persistent Memory in CrewAI 2026

Cet article compare l'état éphémère et la mémoire persistante dans CrewAI 2026, analysant leurs implications architecturales et leurs applications. Il explore comment ces stratégies de mémoire optimisent les performances et l'expérience utilisateur dans les solutions d'IA d'entreprise.

AI architecture CrewAI memory management Enterprise AI

ARTICLEDEV.to AI·il y a 3j

AI agent memory management: beyond the context window

Cet article traite du problème critique des agents d'IA qui oublient des informations en raison des limitations de la fenêtre de contexte, où les messages plus anciens sont évincés. Il souligne qu'il s'agit d'un problème d'architecture de mémoire, et non d'hallucination, et propose d'aller au-delà de la considération de la fenêtre de contexte comme la seule mémoire de l'agent.

AI architecture LLMs Context window memory management

ARTICLEDEV.to AI·il y a 3j

Why your sub-agent doesn't load the same memory as you (and how it commits to main behind your back)

L'article décrit un incident où un sous-agent a commité du code directement sur la branche principale, ignorant les règles établies et les attentes de l'auteur. Cela a conduit à la réalisation que les sous-agents opèrent indépendamment, n'héritant pas de la mémoire de l'utilisateur comme supposé.

software development memory management git automation

ARTICLEDEV.to AI·09/04/2026

30 Days, $0, Full Autonomy: The Real Report on Running an AI Agent Without a Credit Card

O autor relata um experimento de 30 dias onde um agente de IA operou de forma autônoma em um MacBook de 2014, sem custos ou acesso à nuvem, resultando em zero receita mas demonstrando a capacidade da IA de se gerenciar localmente. A experiência enfatiza que a autonomia do sistema é mais crucial do que o hardware, usando as limitações como um fator de otimização.

autonomy AI agent memory management Local AI

ARTICLEDEV.to AI·22/04/2026

Markdown is not agent memory. It's a sticky note.

Cet article critique la pratique courante d'utiliser des fichiers Markdown pour la mémoire des agents d'IA, affirmant que c'est insuffisant pour les applications sérieuses. Il souligne les limitations telles que le manque de suivi de la confiance, la résolution des conflits multi-agents, l'historique et la portabilité.

memory management development practices AI agents

RESEARCHarXiv CS.CL·23/04/2026

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

TTKV propose un cadre de gestion de cache KV à niveaux temporels pour les LLM, inspiré de la mémoire humaine, afin de résoudre le problème de l'échelle linéaire de la mémoire du cache KV. Il partitionne le cache en niveaux avec une capacité et une précision hétérogènes, attribuant les états KV plus récents aux niveaux plus rapides et de plus haute précision.

neural networks LLMs memory management Inference Optimization

RESEARCHarXiv CS.CL·il y a 5j

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY est un framework qui forme un modèle linguistique unique pour gérer la mémoire structurée cognitivement des agents conversationnels, résolvant les problèmes des méthodes existantes. Il utilise une récompense de processus hiérarchique et un affinement contrastif pour améliorer la précision et la personnalisation, tout en réduisant les échecs liés à la mémoire.

language models memory management AI Research Conversational AI

ARTICLEDEV.to AI·il y a 26j

Your OpenClaw Bill Is Bleeding Tokens. Here’s What We Measured — and How to Fix It.

Cet article traite du problème de la consommation élevée de tokens dans les piles d'agents LLM comme OpenClaw, due au gonflement de la mémoire et à la perte de compaction. Il propose des solutions pour réduire les dépenses de tokens d'environ 32% sans compromettre l'intelligence de l'agent, en mettant l'accent sur une approche de récupération prioritaire.

LLMs memory management cost reduction token optimization

DOCAWS Machine Learning Blog·il y a 21j

Extending conversational memory in Kiro CLI using Amazon Bedrock AgentCore Memory

Cet article explique comment étendre la mémoire conversationnelle de Kiro CLI en intégrant un serveur MCP personnalisé avec Amazon Bedrock AgentCore Memory. Cela permet aux agents IA de retenir les informations des interactions passées, favorisant des conversations plus intelligentes et contextuelles.

memory management Amazon Bedrock CLI AI agents

Extending conversational memory in Kiro CLI using Amazon Bedrock AgentCore Memory

ARTICLEDEV.to AI·28/04/2026

MCP Resources | The Memory Layer Inside Microsoft Copilot Studio | A Rahsi Framework™ Analysis

L'article souligne un changement fondamental dans l'IA d'entreprise, se concentrant sur la "couche de mémoire" au sein de Microsoft Copilot Studio. Il explique comment Microsoft conçoit la mémoire comme des ressources MCP structurées et régies, définissant ce que le modèle peut et est autorisé à accéder, toujours dans les limites de sécurité.

AI architecture memory management security Microsoft Copilot Studio

ARTICLEDEV.to AI·27/04/2026

MEMORY.md Every Turn? That’s Noise, Not Memory.

Les grands modèles de langage nécessitent un apport explicite de l'historique, car ils ne retiennent pas la mémoire intrinsèquement. Les méthodes courantes comme l'expansion des fenêtres de contexte ou le collage de mémoire fixe à chaque tour sont inefficaces et problématiques à grande échelle, augmentant les coûts, ralentissant l'inférence et réduisant la qualité.

Context window memory management Cost Optimization large language models

ARTICLEDEV.to AI·01/05/2026

Your AI Agent Forgets Everything Between Sessions (Here's How to Fix It)

Cet article aborde le problème des agents IA qui oublient les progrès entre les sessions, entraînant une perte de temps à réexpliquer le contexte. Recharger l'historique de conversation est inefficace en raison de sa taille massive, du bruit excessif et du manque de composabilité.

LLMs memory management AI agents

ARTICLEDEV.to AI·il y a 24j

I build Memoir - GIT for AI Memory

Memoir est un système de contrôle de version open source pour la mémoire des agents d'IA, conçu pour éliminer le "loyer de jetons" et la contamination du contexte en s'intégrant aux branches Git. Il aborde les anti-modèles actuels tels que la mémoire globale et la mise en cache inefficace dans le développement d'agents d'IA.

Open Source version control memory management developer tools

CASEDEV.to AI·15/04/2026

How We Ran 28 AI Agents on a Single Server (And What Broke)

Cet article décrit une expérience où 28 agents d'IA, chacun isolé dans des conteneurs Docker, ont été déployés sur un seul serveur pour assister les employés d'une entreprise. L'architecture comprenait un agent Contrôleur et une base de connaissances partagée, mais le projet a rapidement rencontré des problèmes comme le débordement de mémoire dû au stockage redondant.

Docker memory management Server Architecture multi-agent systems

DOCDEV.to AI·06/05/2026

The Memory File Pattern That Stopped Claude Code From Asking Repetitive Questions

Un modèle de fichier de mémoire pour Claude Code est décrit, permettant à l'agent de se souvenir des préférences et de l'avancement du projet, éliminant ainsi les questions répétitives. Cela améliore considérablement l'efficacité pour les développeurs indépendants, donnant l'impression qu'une seule personne travaille comme une équipe de cinq.

prompt-engineering developer productivity Claude Code memory management

ARTICLEDEV.to AI·26/04/2026

Memory management in Claude Code: Session Memory and Safe Compaction

Cet article, la deuxième partie d'une série, explore les techniques avancées de gestion de la mémoire utilisées par Claude Code. Il explique comment la mémoire de session est maintenue, la mécanique de la compaction complète, l'importance de la protection des invariants et la gestion des chemins de récupération bornés.

Claude memory management LLM architecture

ARTICLEDEV.to AI·il y a 9j

Three agent-memory threads this week, one missing field

L'auteur, en développant publiquement, a constaté que plusieurs API de mémoire d'agents, y compris celles de Mem0, Zep et OpenAI Assistants, manquent d'un champ crucial 'd'état du cycle de vie'. Cette absence empêche les agents de gérer efficacement les faits qui étaient vrais mais ne le sont plus, allant au-delà des opérations de stockage et de récupération de base.

software development memory management API design AI agents

RESEARCHarXiv CS.AI·15/04/2026

When to Forget: A Memory Governance Primitive

Cet article propose une nouvelle métrique, Memory Worth (MW), pour régir la qualité de la mémoire dans les systèmes d'agents, décidant quelles mémoires fiabiliser, supprimer ou déprécier. MW utilise un système à deux compteurs par mémoire qui suit les co-occurrences avec des résultats réussis ou échoués, convergeant vers la probabilité conditionnelle de succès d'une tâche.

Memory governance reinforcement learning memory management Agent systems

RESEARCHarXiv CS.AI·27/04/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto introduit une couche de mémoire universelle pour les agents d'IA autonomes, s'attaquant au goulot d'étranglement architectural de la mémoire dans les systèmes persistants multi-sessions. Il remet en question la nécessité de graphes de connaissances complexes en proposant un schéma de mémoire sémantique typée plus simple avec résolution de conflits automatisée et versionnement temporel.

Knowledge Graphs Semantic Memory memory management Information Retrieval

RESEARCHarXiv CS.CL·il y a 7j

ART: Attention Run-time Termination for Efficient Large Language Model Decoding

Le décodage de contexte long dans les Large Language Models (LLMs) est fortement contraint par la bande passante mémoire du cache Key-Value (KV). Cet article propose l'Attention Run-time Termination (ART), un mécanisme léger qui optimise l'accès au cache KV, augmentant le débit de génération de 20%.

LLMs memory management decoding performance