← heapsort-ai

Continual Learning

20 items

RESEARCH↑ trendingReddit r/MachineLearning·vor 27T

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Große Sprachmodelle (LLMs) sind mit katastrophalem Vergessen und Plastizitätsverlust konfrontiert, wenn sie ihre Parameter für nachgelagerte Aufgaben aktualisieren. Diese Arbeit stellt ein "schnell-langsam"-Lernframework für LLMs vor, das Modellparameter als langsame Gewichte und optimierten Kontext als schnelle Gewichte nutzt, um sich effizient anzupassen, ohne das allgemeine Denkvermögen zu beeinträchtigen.

42
RESEARCHarXiv CS.AI·4/17/2026

Mistake gating leads to energy and memory efficient continual learning

Diese Arbeit schlägt „memorized mistake-gated learning“ vor, eine biologisch plausible Plastizitätsregel, bei der synaptische Aktualisierungen streng durch aktuelle und vergangene Klassifikationsfehler gesteuert werden. Diese Methode reduziert Netzwerkaktualisierungen um 50–80 %, wodurch die Energie- und Speichereffizienz in kontinuierlichen und Online-Lernszenarien erheblich verbessert wird.

35
RESEARCHarXiv CS.LG·4/16/2026

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

Diese Forschung stellt Adaptive Memory Crystallization (AMC) vor, eine neuartige Speicherarchitektur für autonome KI-Agenten, um Erfahrungen in dynamischen Umgebungen schrittweise zu konsolidieren, ohne früheres Wissen zu vergessen. AMC modelliert das Gedächtnis als kontinuierlichen Kristallisationsprozess in einer dreiphasigen Hierarchie, inspiriert von der Theorie des synaptischen Tagging und Capture und gesteuert durch stochastische Differentialgleichungen.

29
RESEARCHarXiv CS.AI·4/14/2026

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

Adaptive Hierarchical Compression (AHC) ist ein Meta-Lern-Framework für die kontinuierliche Objekterkennung auf speicherbeschränkten Mikrocontrollern, das sich an sich entwickelnde Aufgabenverteilungen anpasst. Es nutzt MAML-basierte adaptive Kompression, hierarchische Mehrskalenkompression und eine Dual-Speicher-Architektur, um katastrophales Vergessen innerhalb eines strengen 100KB Speicherbudgets zu verhindern.

28
RESEARCHarXiv CS.LG·vor 5T

Position: Deployed Reinforcement Learning should be Continual

Dieses Positionspapier argumentiert, dass eingesetzte Reinforcement Learning (RL)-Agenten kontinuierliches Lernen betreiben sollten, anstatt einem Train-then-Fix-Paradigma zu folgen. Es identifiziert vier Quellen der Nicht-Stationarität nach der Bereitstellung und betont die Notwendigkeit, dass Agenten sich kontinuierlich anpassen, um optimale Leistung in realen Szenarien zu erzielen.

28
RESEARCHarXiv CS.CL·4/20/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Große Sprachmodelle neigen dazu, faktisch inkorrekte Aussagen zu halluzinieren, ein Problem, das durch überwachtes Fine-Tuning (SFT) verstärkt wird, welches das vorab erworbene Wissen abbaut. Diese Forschung schlägt eine selbst-destillationsbasierte SFT-Methode vor, inspiriert vom kontinuierlichen Lernen, um Halluzinationen durch die Regularisierung der Ausgabe-Distributionsdrift zu mindern, während neue Fakten effektiv gelernt werden.

27
ARTICLEDEV.to AI·vor 24T

Meta-Optimized Continual Adaptation for heritage language revitalization programs under multi-jurisdictional compliance

Der Autor erkannte die dringende Notwendigkeit von KI zur Bewahrung bedrohter Sprachen und stieß dabei auf Herausforderungen wie katastrophales Vergessen in neuronalen Übersetzungssystemen und komplexe Gesetze zur Datensouveränität in mehreren Gerichtsbarkeiten. Die Arbeit konzentriert sich auf meta-optimierte kontinuierliche Anpassung für Programme zur Revitalisierung von Minderheitensprachen.

27
RESEARCHDEV.to AI·4/21/2026

Continual Learning via Neural Pruning

Dieser Inhalt befasst sich voraussichtlich mit dem Konzept des kontinuierlichen Lernens, einer zentralen Herausforderung in der KI, durch den Einsatz von neuronalen Beschneidungstechniken. Ziel ist es zu zeigen, wie das Beschneiden Modelle befähigen kann, sequentiell neues Wissen zu erwerben, ohne zuvor gelernte Informationen zu vergessen.

27
RESEARCHarXiv CS.LG·5/1/2026

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

Diese Studie untersucht die Rolle des externen Speichers in LLM-Agenten für kontinuierliches Lernen und zeigt, dass das Stabilitäts-Plastizitäts-Dilemma bei begrenzten Kontextfenstern auf die Speicherebene verlagert wird. Ein (k,v)-Framework wird eingeführt, um die Darstellung und Organisation von Erfahrungen zu entflechten, wobei festgestellt wird, dass abstrakte prozedurale Erinnerungen zuverlässiger übertragen werden und eine feinere Speicherorganisation vorteilhaft ist.

27
RESEARCHarXiv CS.LG·5/7/2026

Continual Distillation of Teachers from Different Domains

Diese Forschung stellt Continual Distillation (CD) vor, ein neues Paradigma, bei dem ein Schülermodell sequenziell von einem Strom von Lehrmodellen lernt, ohne frühere Lehrer beizubehalten. Es adressiert Herausforderungen wie den Transfer (UKT) und das Vergessen (UKF) von ungesehenem Wissen mittels Self External Data Distillation (SE2D), das unbeschriftete externe Daten verwendet, um das Lernen über heterogene Lehrer hinweg zu stabilisieren.

27
RESEARCHarXiv CS.AI·vor 29T

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

Dieses Papier formalisiert Deployment-Time Learning (DTL) als eine neue Phase für LLMs, die es ihnen ermöglicht, sich nach dem Training kontinuierlich aus Erfahrungen anzupassen, ohne Modellparameter zu ändern. Es stellt CASCADE vor, ein Framework, das LLM-Agenten mit einem expliziten, sich entwickelnden episodischen Gedächtnis ausstattet und die Wiederverwendung von Erfahrungen als kontextuelles Bandit-Problem formalisiert.

27
RESEARCHarXiv CS.LG·vor 12T

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Dieses Papier schlägt einen neuen leichten Selektor vor, um Logit-Shift-Trends im Kontinuierlichen Lernen (CL) zu erfassen, einer rechenintensiven Herausforderung bei der Auswahl vortrainierter Modelle. Die Forschung befasst sich mit der architektonischen Heterogenität neuronaler Netze, indem sie die Abhängigkeit von Architektur und Daten entkoppelt, um ein neues theoretisches Framework zu etablieren.

27
RESEARCHarXiv CS.CL·4/6/2026

Revealing the Learning Dynamics of Long-Context Continual Pre-training

Este artigo investiga sistematicamente as dinâmicas de aprendizado do Pré-treinamento Contínuo de Contexto Longo (LCCP) usando o modelo industrial Hunyuan-A13B, rastreando sua evolução por 200 bilhões de tokens. Ele propõe uma estrutura hierárquica para analisar o LCCP em níveis comportamental, probabilístico e mecanicista, abordando as limitações das metodologias atuais de avaliação e pré-treinamento.

27
ARTICLELangChain Blog·4/5/2026

Continual learning for AI agents

Dieser Inhalt behandelt kontinuierliches Lernen für KI-Agenten und schlägt vor, dass Lernen über das bloße Aktualisieren von Modellgewichten hinausgeht. Er führt drei unterschiedliche Schichten ein – das Modell, das Harness und den Kontext – und betont, wie diese Perspektive den Ansatz zur Entwicklung sich verbessernder KI-Systeme verändert.

Continual learning for AI agents
26