← heapsort-ai

memory management

25 items

ARTICLEDEV.to AI·il y a 3j

AI agent memory management: beyond the context window

Cet article traite du problème critique des agents d'IA qui oublient des informations en raison des limitations de la fenêtre de contexte, où les messages plus anciens sont évincés. Il souligne qu'il s'agit d'un problème d'architecture de mémoire, et non d'hallucination, et propose d'aller au-delà de la considération de la fenêtre de contexte comme la seule mémoire de l'agent.

31
ARTICLEDEV.to AI·09/04/2026

30 Days, $0, Full Autonomy: The Real Report on Running an AI Agent Without a Credit Card

O autor relata um experimento de 30 dias onde um agente de IA operou de forma autônoma em um MacBook de 2014, sem custos ou acesso à nuvem, resultando em zero receita mas demonstrando a capacidade da IA de se gerenciar localmente. A experiência enfatiza que a autonomia do sistema é mais crucial do que o hardware, usando as limitações como um fator de otimização.

30
RESEARCHarXiv CS.CL·23/04/2026

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

TTKV propose un cadre de gestion de cache KV à niveaux temporels pour les LLM, inspiré de la mémoire humaine, afin de résoudre le problème de l'échelle linéaire de la mémoire du cache KV. Il partitionne le cache en niveaux avec une capacité et une précision hétérogènes, attribuant les états KV plus récents aux niveaux plus rapides et de plus haute précision.

28
RESEARCHarXiv CS.CL·il y a 5j

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY est un framework qui forme un modèle linguistique unique pour gérer la mémoire structurée cognitivement des agents conversationnels, résolvant les problèmes des méthodes existantes. Il utilise une récompense de processus hiérarchique et un affinement contrastif pour améliorer la précision et la personnalisation, tout en réduisant les échecs liés à la mémoire.

28
ARTICLEDEV.to AI·il y a 26j

Your OpenClaw Bill Is Bleeding Tokens. Here’s What We Measured — and How to Fix It.

Cet article traite du problème de la consommation élevée de tokens dans les piles d'agents LLM comme OpenClaw, due au gonflement de la mémoire et à la perte de compaction. Il propose des solutions pour réduire les dépenses de tokens d'environ 32% sans compromettre l'intelligence de l'agent, en mettant l'accent sur une approche de récupération prioritaire.

28
ARTICLEDEV.to AI·28/04/2026

MCP Resources | The Memory Layer Inside Microsoft Copilot Studio | A Rahsi Framework™ Analysis

L'article souligne un changement fondamental dans l'IA d'entreprise, se concentrant sur la "couche de mémoire" au sein de Microsoft Copilot Studio. Il explique comment Microsoft conçoit la mémoire comme des ressources MCP structurées et régies, définissant ce que le modèle peut et est autorisé à accéder, toujours dans les limites de sécurité.

27
ARTICLEDEV.to AI·27/04/2026

MEMORY.md Every Turn? That’s Noise, Not Memory.

Les grands modèles de langage nécessitent un apport explicite de l'historique, car ils ne retiennent pas la mémoire intrinsèquement. Les méthodes courantes comme l'expansion des fenêtres de contexte ou le collage de mémoire fixe à chaque tour sont inefficaces et problématiques à grande échelle, augmentant les coûts, ralentissant l'inférence et réduisant la qualité.

27
CASEDEV.to AI·15/04/2026

How We Ran 28 AI Agents on a Single Server (And What Broke)

Cet article décrit une expérience où 28 agents d'IA, chacun isolé dans des conteneurs Docker, ont été déployés sur un seul serveur pour assister les employés d'une entreprise. L'architecture comprenait un agent Contrôleur et une base de connaissances partagée, mais le projet a rapidement rencontré des problèmes comme le débordement de mémoire dû au stockage redondant.

27
DOCDEV.to AI·06/05/2026

The Memory File Pattern That Stopped Claude Code From Asking Repetitive Questions

Un modèle de fichier de mémoire pour Claude Code est décrit, permettant à l'agent de se souvenir des préférences et de l'avancement du projet, éliminant ainsi les questions répétitives. Cela améliore considérablement l'efficacité pour les développeurs indépendants, donnant l'impression qu'une seule personne travaille comme une équipe de cinq.

27
ARTICLEDEV.to AI·il y a 9j

Three agent-memory threads this week, one missing field

L'auteur, en développant publiquement, a constaté que plusieurs API de mémoire d'agents, y compris celles de Mem0, Zep et OpenAI Assistants, manquent d'un champ crucial 'd'état du cycle de vie'. Cette absence empêche les agents de gérer efficacement les faits qui étaient vrais mais ne le sont plus, allant au-delà des opérations de stockage et de récupération de base.

27
RESEARCHarXiv CS.AI·15/04/2026

When to Forget: A Memory Governance Primitive

Cet article propose une nouvelle métrique, Memory Worth (MW), pour régir la qualité de la mémoire dans les systèmes d'agents, décidant quelles mémoires fiabiliser, supprimer ou déprécier. MW utilise un système à deux compteurs par mémoire qui suit les co-occurrences avec des résultats réussis ou échoués, convergeant vers la probabilité conditionnelle de succès d'une tâche.

27
RESEARCHarXiv CS.AI·27/04/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto introduit une couche de mémoire universelle pour les agents d'IA autonomes, s'attaquant au goulot d'étranglement architectural de la mémoire dans les systèmes persistants multi-sessions. Il remet en question la nécessité de graphes de connaissances complexes en proposant un schéma de mémoire sémantique typée plus simple avec résolution de conflits automatisée et versionnement temporel.

27