Continual Learning

20 items

RESEARCH↑ trendingReddit r/MachineLearning·vor 27T

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Große Sprachmodelle (LLMs) sind mit katastrophalem Vergessen und Plastizitätsverlust konfrontiert, wenn sie ihre Parameter für nachgelagerte Aufgaben aktualisieren. Diese Arbeit stellt ein "schnell-langsam"-Lernframework für LLMs vor, das Modellparameter als langsame Gewichte und optimierten Kontext als schnelle Gewichte nutzt, um sich effizient anzupassen, ohne das allgemeine Denkvermögen zu beeinträchtigen.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHarXiv CS.AI·4/17/2026

Mistake gating leads to energy and memory efficient continual learning

Diese Arbeit schlägt „memorized mistake-gated learning“ vor, eine biologisch plausible Plastizitätsregel, bei der synaptische Aktualisierungen streng durch aktuelle und vergangene Klassifikationsfehler gesteuert werden. Diese Methode reduziert Netzwerkaktualisierungen um 50–80 %, wodurch die Energie- und Speichereffizienz in kontinuierlichen und Online-Lernszenarien erheblich verbessert wird.

neural networks efficiency learning algorithms Continual Learning

RESEARCHarXiv CS.LG·4/16/2026

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

Diese Forschung stellt Adaptive Memory Crystallization (AMC) vor, eine neuartige Speicherarchitektur für autonome KI-Agenten, um Erfahrungen in dynamischen Umgebungen schrittweise zu konsolidieren, ohne früheres Wissen zu vergessen. AMC modelliert das Gedächtnis als kontinuierlichen Kristallisationsprozess in einer dreiphasigen Hierarchie, inspiriert von der Theorie des synaptischen Tagging und Capture und gesteuert durch stochastische Differentialgleichungen.

reinforcement learning machine learning memory architecture AI agents

RESEARCHarXiv CS.AI·4/14/2026

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

Adaptive Hierarchical Compression (AHC) ist ein Meta-Lern-Framework für die kontinuierliche Objekterkennung auf speicherbeschränkten Mikrocontrollern, das sich an sich entwickelnde Aufgabenverteilungen anpasst. Es nutzt MAML-basierte adaptive Kompression, hierarchische Mehrskalenkompression und eine Dual-Speicher-Architektur, um katastrophales Vergessen innerhalb eines strengen 100KB Speicherbudgets zu verhindern.

Meta-Learning Adaptive Compression Microcontrollers object detection

RESEARCHarXiv CS.LG·vor 5T

Position: Deployed Reinforcement Learning should be Continual

Dieses Positionspapier argumentiert, dass eingesetzte Reinforcement Learning (RL)-Agenten kontinuierliches Lernen betreiben sollten, anstatt einem Train-then-Fix-Paradigma zu folgen. Es identifiziert vier Quellen der Nicht-Stationarität nach der Bereitstellung und betont die Notwendigkeit, dass Agenten sich kontinuierlich anpassen, um optimale Leistung in realen Szenarien zu erzielen.

reinforcement learning learning Adaptive AI AI deployment

RESEARCHarXiv CS.CL·4/20/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Große Sprachmodelle neigen dazu, faktisch inkorrekte Aussagen zu halluzinieren, ein Problem, das durch überwachtes Fine-Tuning (SFT) verstärkt wird, welches das vorab erworbene Wissen abbaut. Diese Forschung schlägt eine selbst-destillationsbasierte SFT-Methode vor, inspiriert vom kontinuierlichen Lernen, um Halluzinationen durch die Regularisierung der Ausgabe-Distributionsdrift zu mindern, während neue Fakten effektiv gelernt werden.

hallucinations large language models Fine-tuning Continual Learning

ARTICLEDEV.to AI·vor 27T

DeepMind’s CEO Says AGI May Be ~4 Years Away. The Last Three Missing Pieces Are Not What Most People Think.

Demis Hassabis, CEO von Google DeepMind, prognostiziert, dass AGI um 2030 eintreffen könnte und nennt drei kritische Lücken in der aktuellen KI: kontinuierliches Lernen, langfristiges Denken und echtes Gedächtnis. Er beschreibt heutige Modelle als "ungleiche Intelligenz", mit hohen Leistungen neben elementaren Fehlern.

DeepMind AGI Reasoning AI development

RESEARCHDEV.to AI·4/26/2026

Deep Generative Dual Memory Network for Continual Learning

Der Titel „Deep Generative Dual Memory Network for Continual Learning“ beschreibt eine tiefe generative neuronale Netzwerkarchitektur. Ziel ist es, kontinuierliches Lernen zu ermöglichen, bei dem das Modell neue Informationen aufnehmen kann, ohne zuvor Gelerntes zu vergessen, indem ein dualer Speicheransatz verwendet wird.

neural networks deep learning Continual Learning Generative AI

ARTICLEDEV.to AI·vor 24T

Meta-Optimized Continual Adaptation for heritage language revitalization programs under multi-jurisdictional compliance

Der Autor erkannte die dringende Notwendigkeit von KI zur Bewahrung bedrohter Sprachen und stieß dabei auf Herausforderungen wie katastrophales Vergessen in neuronalen Übersetzungssystemen und komplexe Gesetze zur Datensouveränität in mehreren Gerichtsbarkeiten. Die Arbeit konzentriert sich auf meta-optimierte kontinuierliche Anpassung für Programme zur Revitalisierung von Minderheitensprachen.

data compliance AI indigenous languages language revitalization

RESEARCHDEV.to AI·4/21/2026

Continual Learning via Neural Pruning

Dieser Inhalt befasst sich voraussichtlich mit dem Konzept des kontinuierlichen Lernens, einer zentralen Herausforderung in der KI, durch den Einsatz von neuronalen Beschneidungstechniken. Ziel ist es zu zeigen, wie das Beschneiden Modelle befähigen kann, sequentiell neues Wissen zu erwerben, ohne zuvor gelernte Informationen zu vergessen.

neural-pruning machine learning Continual Learning

RESEARCHDEV.to AI·4/14/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Dieser Inhalt führt neuartige Metriken für Continual Learning ein und erweitert die Evaluierung über die bloße Verhinderung katastrophalen Vergessens hinaus. Er schlägt eine umfassendere Sichtweise zur Messung der Leistung von KI-Modellen in sequenziellen Lernszenarien vor.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·5/1/2026

NORACL: Neurogenesis for Oracle-free Resource-Adaptive Continual Learning

Der Artikel schlägt NORACL vor, inspiriert von biologischer Neurogenese, um das Stabilitäts-Plastizitäts-Dilemma im kontinuierlichen Lernen zu lösen. Er adressiert das Orakel-Architektur-Problem, bei dem endliche Netzwerke begrenzte Ressourcen für unbekannte zukünftige Aufgaben haben.

neural networks machine learning neurogenesis Continual Learning

RESEARCHarXiv CS.LG·5/1/2026

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

Diese Studie untersucht die Rolle des externen Speichers in LLM-Agenten für kontinuierliches Lernen und zeigt, dass das Stabilitäts-Plastizitäts-Dilemma bei begrenzten Kontextfenstern auf die Speicherebene verlagert wird. Ein (k,v)-Framework wird eingeführt, um die Darstellung und Organisation von Erfahrungen zu entflechten, wobei festgestellt wird, dass abstrakte prozedurale Erinnerungen zuverlässiger übertragen werden und eine feinere Speicherorganisation vorteilhaft ist.

research memory AI agents Continual Learning

RESEARCHarXiv CS.LG·vor 19T

CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

CP-MoE begegnet dem katastrophalen Vergessen im kontinuierlichen Lernen für LLMs und VLMs mittels Mixture-of-Experts-Architekturen. Es führt einen transienten Experten und konsistenzerhaltendes Routing ein, um neues Wissen zu integrieren und das Überschreiben bestehender Parameter zu verhindern.

LLMs VLMs learning Mixture of Experts

RESEARCHarXiv CS.LG·5/7/2026

Continual Distillation of Teachers from Different Domains

Diese Forschung stellt Continual Distillation (CD) vor, ein neues Paradigma, bei dem ein Schülermodell sequenziell von einem Strom von Lehrmodellen lernt, ohne frühere Lehrer beizubehalten. Es adressiert Herausforderungen wie den Transfer (UKT) und das Vergessen (UKF) von ungesehenem Wissen mittels Self External Data Distillation (SE2D), das unbeschriftete externe Daten verwendet, um das Lernen über heterogene Lehrer hinweg zu stabilisieren.

Knowledge Distillation deep learning learning Continual Learning

RESEARCHarXiv CS.AI·vor 29T

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

Dieses Papier formalisiert Deployment-Time Learning (DTL) als eine neue Phase für LLMs, die es ihnen ermöglicht, sich nach dem Training kontinuierlich aus Erfahrungen anzupassen, ohne Modellparameter zu ändern. Es stellt CASCADE vor, ein Framework, das LLM-Agenten mit einem expliziten, sich entwickelnden episodischen Gedächtnis ausstattet und die Wiederverwendung von Erfahrungen als kontextuelles Bandit-Problem formalisiert.

LLMs adaptation machine learning AI deployment

RESEARCHarXiv CS.LG·vor 12T

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Dieses Papier schlägt einen neuen leichten Selektor vor, um Logit-Shift-Trends im Kontinuierlichen Lernen (CL) zu erfassen, einer rechenintensiven Herausforderung bei der Auswahl vortrainierter Modelle. Die Forschung befasst sich mit der architektonischen Heterogenität neuronaler Netze, indem sie die Abhängigkeit von Architektur und Daten entkoppelt, um ein neues theoretisches Framework zu etablieren.

neural networks model selection learning Logit Shift

RESEARCHarXiv CS.CL·4/6/2026

Revealing the Learning Dynamics of Long-Context Continual Pre-training

Este artigo investiga sistematicamente as dinâmicas de aprendizado do Pré-treinamento Contínuo de Contexto Longo (LCCP) usando o modelo industrial Hunyuan-A13B, rastreando sua evolução por 200 bilhões de tokens. Ele propõe uma estrutura hierárquica para analisar o LCCP em níveis comportamental, probabilístico e mecanicista, abordando as limitações das metodologias atuais de avaliação e pré-treinamento.

Long-Context Continual Pre-training Model Evaluation Pre-training Dynamics large language models

NEWSLangChain Blog·vor 21T

Introducing LangChain Labs

LangChain Labs ist eine neue angewandte Forschungsinitiative, die sich auf kontinuierliches Lernen für Agenten konzentriert. Sie fördert mit Partnern offene Forschung an selbstverbessernden KI-Systemen.

LangChain self-improving AI AI Research AI agents

ARTICLELangChain Blog·4/5/2026

Continual learning for AI agents

Dieser Inhalt behandelt kontinuierliches Lernen für KI-Agenten und schlägt vor, dass Lernen über das bloße Aktualisieren von Modellgewichten hinausgeht. Er führt drei unterschiedliche Schichten ein – das Modell, das Harness und den Kontext – und betont, wie diese Perspektive den Ansatz zur Entwicklung sich verbessernder KI-Systeme verändert.

Model weights AI system design machine learning AI agents