← heapsort-ai

memory management

25 items

ARTICLEDEV.to AI·vor 3T

AI agent memory management: beyond the context window

Dieser Artikel behandelt das kritische Problem, dass KI-Agenten Informationen aufgrund von Kontextfensterbeschränkungen vergessen, wobei ältere Nachrichten entfernt werden. Er hebt hervor, dass dies ein Problem der Speicherarchitektur und keine Halluzination ist, und schlägt vor, über die bloße Nutzung des Kontextfensters als einzigen Speicher des Agenten hinauszugehen.

31
ARTICLEDEV.to AI·4/9/2026

30 Days, $0, Full Autonomy: The Real Report on Running an AI Agent Without a Credit Card

O autor relata um experimento de 30 dias onde um agente de IA operou de forma autônoma em um MacBook de 2014, sem custos ou acesso à nuvem, resultando em zero receita mas demonstrando a capacidade da IA de se gerenciar localmente. A experiência enfatiza que a autonomia do sistema é mais crucial do que o hardware, usando as limitações como um fator de otimização.

30
RESEARCHarXiv CS.CL·4/23/2026

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

TTKV schlägt ein zeitlich gestaffeltes KV-Cache-Management-Framework für LLMs vor, das von menschlichen Gedächtnissystemen inspiriert ist, um das Problem der linearen Skalierung des KV-Cache-Speichers zu lösen. Es teilt den Cache in Schichten mit heterogener Kapazität und Präzision auf, wobei neuere KV-Zustände schnelleren, hochpräzisen Schichten zugewiesen werden.

28
RESEARCHarXiv CS.CL·vor 5T

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SALIMORY ist ein Framework, das ein einziges Sprachmodell trainiert, um kognitiv strukturierte Speicher für Konversationsagenten zu verwalten, und adressiert Probleme bestehender Methoden. Es nutzt eine hierarchische stufenweise Prozessbelohnung und kontrastive Verfeinerung, was zu erheblichen Verbesserungen bei Genauigkeit und Personalisierung führt und speicherbedingte Fehler reduziert.

28
ARTICLEDEV.to AI·4/28/2026

MCP Resources | The Memory Layer Inside Microsoft Copilot Studio | A Rahsi Framework™ Analysis

Dieser Artikel beleuchtet eine grundlegende Verschiebung in der Unternehmens-KI, die sich auf die „Speicherebene“ innerhalb von Microsoft Copilot Studio konzentriert. Er erklärt, wie Microsoft den Speicher als strukturierte und gesteuerte MCP-Ressourcen konzipiert, die festlegen, worauf das Modell zugreifen darf und in welchem Sicherheitsrahmen dies geschieht.

27
ARTICLEDEV.to AI·4/27/2026

MEMORY.md Every Turn? That’s Noise, Not Memory.

Große Sprachmodelle erfordern eine explizite Historienzufuhr, da sie keine inhärente Erinnerung behalten. Gängige Methoden wie die Erweiterung von Kontextfenstern oder das Einfügen fester Notizen in jeder Runde erweisen sich im großen Maßstab als ineffizient und problematisch, was zu höheren Kosten, langsamerer Inferenz und verminderter Qualität führt.

27
CASEDEV.to AI·4/15/2026

How We Ran 28 AI Agents on a Single Server (And What Broke)

Dieser Artikel beschreibt ein Experiment, bei dem ein Unternehmen 28 KI-Agenten, jeweils isoliert in Docker-Containern auf einem einzigen Server, einsetzte, um jeden menschlichen Mitarbeiter zu unterstützen. Das Setup umfasste einen Controller-Agenten zur Verwaltung der Flotte und eine gemeinsame Wissensdatenbank, doch das Experiment sah sich schnell Herausforderungen wie Speicherüberlauf aufgrund redundanter Langzeitspeicherung gegenüber.

27
ARTICLEDEV.to AI·vor 9T

Three agent-memory threads this week, one missing field

Der Autor stellte beim öffentlichen Bauen fest, dass mehreren Agenten-Speicher-APIs, darunter die von Mem0, Zep und OpenAI Assistants, ein entscheidendes Feld für den 'Lebenszyklusstatus' fehlt. Dieses Fehlen verhindert, dass Agenten Fakten effektiv verwalten können, die einst wahr waren, aber nicht mehr zutreffen, und geht über einfache Speicher- und Abrufvorgänge hinaus.

27
RESEARCHarXiv CS.AI·4/15/2026

When to Forget: A Memory Governance Primitive

Dieses Papier stellt Memory Worth (MW) als neue Metrik zur Steuerung der Speicherqualität in Agentensystemen vor, um zu entscheiden, welchen Erinnerungen zu vertrauen, welche zu unterdrücken oder welche zu verwerfen sind. MW nutzt ein Zwei-Zähler-System pro Speicher, das Kookkurrenzen mit erfolgreichen und fehlgeschlagenen Ergebnissen verfolgt und zur bedingten Erfolgswahrscheinlichkeit einer Aufgabe konvergiert.

27
RESEARCHarXiv CS.AI·4/27/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto stellt eine universelle Speicherschicht für autonome KI-Agenten vor, die den architektonischen Engpass des Speichers in persistenten Multi-Session-Systemen adressiert. Es stellt die Notwendigkeit komplexer Wissensgraphen in Frage, indem es ein einfacheres getyptes semantisches Speicherschema mit automatischer Konfliktlösung und temporaler Versionierung vorschlägt.

27