Continual Learning

20 items

RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Les grands modèles linguistiques (LLM) sont confrontés à l'oubli catastrophique et à la perte de plasticité lors de la mise à jour de leurs paramètres pour des tâches spécifiques. Ce travail introduit un cadre d'apprentissage "rapide-lent" pour les LLM, utilisant les paramètres du modèle comme poids lents et le contexte optimisé comme poids rapides pour s'adapter efficacement sans compromettre le raisonnement général.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHarXiv CS.AI·17/04/2026

Mistake gating leads to energy and memory efficient continual learning

Cette recherche propose l'« apprentissage à porte d'erreur mémorisée », une règle de plasticité biologiquement plausible qui ne met à jour les synapses qu'en cas d'erreurs de classification. Cette méthode réduit le nombre de mises à jour du réseau de 50% à 80%, améliorant l'efficacité énergétique et de la mémoire dans les scénarios d'apprentissage continu et en ligne.

neural networks efficiency learning algorithms Continual Learning

RESEARCHarXiv CS.LG·16/04/2026

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

Cette recherche introduit la Cristallisation Adaptative de la Mémoire (AMC), une nouvelle architecture de mémoire pour permettre aux agents d'IA autonomes de consolider progressivement leurs expériences sans oublier les connaissances antérieures. L'AMC modélise la mémoire comme un processus continu de cristallisation sur une hiérarchie en trois phases, inspirée par la théorie du marquage et de la capture synaptique.

reinforcement learning machine learning memory architecture AI agents

RESEARCHarXiv CS.AI·14/04/2026

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

AHC est un cadre de méta-apprentissage pour la détection continue d'objets sur microcontrôleurs à mémoire limitée, s'adaptant aux distributions de tâches évolutives. Il utilise une compression adaptative basée sur MAML, une compression hiérarchique multi-échelle et une architecture à double mémoire pour prévenir l'oubli catastrophique avec un budget de 100KB.

Meta-Learning Adaptive Compression Microcontrollers object detection

RESEARCHarXiv CS.LG·il y a 5j

Position: Deployed Reinforcement Learning should be Continual

Cet article de position soutient que les agents d'apprentissage par renforcement (RL) déployés devraient s'engager dans un apprentissage continu plutôt que dans un paradigme d'entraînement puis de correction. Il identifie quatre sources de non-stationnarité après le déploiement, soulignant la nécessité pour les agents de s'adapter continuellement pour atteindre des performances optimales dans des scénarios du monde réel.

reinforcement learning learning Adaptive AI AI deployment

RESEARCHarXiv CS.CL·20/04/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Les grands modèles de langage sont souvent sujets aux hallucinations factuelles, un problème aggravé par le réglage fin supervisé (SFT) qui dégrade les connaissances pré-entraînées. Cette recherche propose une méthode SFT basée sur l'auto-distillation, inspirée de l'apprentissage continu, pour atténuer les hallucinations en régularisant la dérive de la distribution de sortie, tout en acquérant efficacement de nouvelles informations factuelles.

hallucinations large language models Fine-tuning Continual Learning

ARTICLEDEV.to AI·il y a 27j

DeepMind’s CEO Says AGI May Be ~4 Years Away. The Last Three Missing Pieces Are Not What Most People Think.

Demis Hassabis, PDG de Google DeepMind, prédit que l'AGI pourrait arriver vers 2030, identifiant trois pièces manquantes critiques dans l'IA actuelle : l'apprentissage continu, le raisonnement à long terme et la mémoire réelle. Il décrit les modèles actuels comme présentant une "intelligence inégale", avec de fortes réussites et des échecs fragiles.

DeepMind AGI Reasoning AI development

RESEARCHDEV.to AI·26/04/2026

Deep Generative Dual Memory Network for Continual Learning

Le titre "Deep Generative Dual Memory Network for Continual Learning" décrit une architecture de réseau neuronal profond et génératif. Il vise à permettre l'apprentissage continu, où le modèle peut acquérir de nouvelles informations sans oublier les connaissances antérieures, en utilisant une approche de double mémoire.

neural networks deep learning Continual Learning Generative AI

ARTICLEDEV.to AI·il y a 24j

Meta-Optimized Continual Adaptation for heritage language revitalization programs under multi-jurisdictional compliance

L'auteur a réalisé le besoin critique de l'IA dans la préservation des langues en voie de disparition, rencontrant des défis tels que l'oubli catastrophique dans les systèmes de traduction neuronale et les lois complexes de souveraineté des données multijuridictionnelles. Le travail se concentre sur l'adaptation continue méta-optimisée pour les programmes de revitalisation des langues patrimoniales.

data compliance AI indigenous languages language revitalization

RESEARCHDEV.to AI·21/04/2026

Continual Learning via Neural Pruning

Ce contenu explore probablement le concept d'apprentissage continu, un défi majeur en IA, en exploitant les techniques d'élagage neuronal. Il vise à démontrer comment l'élagage peut permettre aux modèles d'acquérir séquentiellement de nouvelles connaissances sans oublier les informations apprises précédemment.

neural-pruning machine learning Continual Learning

RESEARCHDEV.to AI·14/04/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Ce contenu présente de nouvelles métriques pour l'Apprentissage Continu, élargissant l'évaluation au-delà de la simple prévention de l'oubli catastrophique. Il propose une vision plus complète pour mesurer les performances des modèles d'IA dans les scénarios d'apprentissage séquentiel.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·01/05/2026

NORACL: Neurogenesis for Oracle-free Resource-Adaptive Continual Learning

L'article propose NORACL, inspiré de la neurogenèse biologique, pour résoudre le dilemme stabilité-plasticité en apprentissage continu. Il s'attaque au problème de l'architecture oracle, où les réseaux finis ont des ressources limitées pour des tâches futures inconnues.

neural networks machine learning neurogenesis Continual Learning

RESEARCHarXiv CS.LG·01/05/2026

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

Cette étude analyse le rôle de la mémoire externe dans les agents LLM pour l'apprentissage continu, montrant que le dilemme stabilité-plasticité réapparaît au niveau de la mémoire sous des fenêtres de contexte limitées. Un cadre (k,v) est introduit pour dissocier la représentation et l'organisation de l'expérience, révélant que les souvenirs procéduraux abstraits se transfèrent plus fiablement et qu'une organisation de mémoire plus fine est bénéfique.

research memory AI agents Continual Learning

RESEARCHarXiv CS.LG·il y a 19j

CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

CP-MoE s'attaque à l'oubli catastrophique dans l'apprentissage continu pour les LLM et VLM utilisant des architectures Mixture-of-Experts. Il introduit un expert transitoire et un routage préservant la cohérence pour intégrer de nouvelles connaissances tout en empêchant l'écrasement des paramètres existants.

LLMs VLMs learning Mixture of Experts

RESEARCHarXiv CS.LG·07/05/2026

Continual Distillation of Teachers from Different Domains

Cette recherche introduit la Distillation Continue (CD), un nouveau paradigme où un modèle étudiant apprend séquentiellement d'un flux de modèles enseignants sans retenir l'accès aux précédents. Elle aborde les défis tels que le transfert (UKT) et l'oubli (UKF) des connaissances invisibles grâce à la Distillation de Données Externes Auto-Supervisées (SE2D), qui utilise des données externes non étiquetées pour stabiliser l'apprentissage à travers des enseignants hétérogènes.

Knowledge Distillation deep learning learning Continual Learning

RESEARCHarXiv CS.AI·il y a 29j

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

Cet article formalise l'Apprentissage en Temps de Déploiement (DTL) comme une nouvelle étape pour les LLM, leur permettant de s'adapter continuellement à partir de l'expérience post-entraînement sans modifier les paramètres du modèle. Il introduit CASCADE, un cadre qui dote les agents LLM d'une mémoire épisodique explicite et évolutive, formalisant la réutilisation d'expérience comme un problème de bandit contextuel.

LLMs adaptation machine learning AI deployment

RESEARCHarXiv CS.LG·il y a 12j

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Cet article propose un nouveau sélecteur léger pour capturer les tendances de 'logit shift' en Apprentissage Continu (CL), un défi coûteux en calcul dans la sélection de modèles pré-entraînés. La recherche aborde l'hétérogénéité architecturale des réseaux neuronaux, en découplant la dépendance de l'architecture et des données pour établir un nouveau cadre théorique.

neural networks model selection learning Logit Shift

RESEARCHarXiv CS.CL·06/04/2026

Revealing the Learning Dynamics of Long-Context Continual Pre-training

Este artigo investiga sistematicamente as dinâmicas de aprendizado do Pré-treinamento Contínuo de Contexto Longo (LCCP) usando o modelo industrial Hunyuan-A13B, rastreando sua evolução por 200 bilhões de tokens. Ele propõe uma estrutura hierárquica para analisar o LCCP em níveis comportamental, probabilístico e mecanicista, abordando as limitações das metodologias atuais de avaliação e pré-treinamento.

Long-Context Continual Pre-training Model Evaluation Pre-training Dynamics large language models

NEWSLangChain Blog·il y a 21j

Introducing LangChain Labs

LangChain Labs est un nouvel effort de recherche appliquée axé sur l'apprentissage continu pour les agents. Il vise, avec des partenaires, à faire progresser la recherche ouverte sur les systèmes d'IA auto-améliorants.

LangChain self-improving AI AI Research AI agents

ARTICLELangChain Blog·05/04/2026

Continual learning for AI agents

Ce contenu traite de l'apprentissage continu pour les agents d'IA, suggérant que l'apprentissage s'étend au-delà de la simple mise à jour des poids du modèle. Il introduit trois couches distinctes où l'apprentissage peut se produire – le modèle, le harnais et le contexte – soulignant comment cette perspective modifie l'approche de construction de systèmes d'IA qui s'améliorent avec le temps.

Model weights AI system design machine learning AI agents