Catastrophic Forgetting

5 items

RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Les grands modèles linguistiques (LLM) sont confrontés à l'oubli catastrophique et à la perte de plasticité lors de la mise à jour de leurs paramètres pour des tâches spécifiques. Ce travail introduit un cadre d'apprentissage "rapide-lent" pour les LLM, utilisant les paramètres du modèle comme poids lents et le contexte optimisé comme poids rapides pour s'adapter efficacement sans compromettre le raisonnement général.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHDEV.to AI·14/04/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Ce contenu présente de nouvelles métriques pour l'Apprentissage Continu, élargissant l'évaluation au-delà de la simple prévention de l'oubli catastrophique. Il propose une vision plus complète pour mesurer les performances des modèles d'IA dans les scénarios d'apprentissage séquentiel.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·15/04/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Cette recherche analyse le Supervised Fine-Tuning (SFT), révélant que les capacités de suivi des instructions émergent distinctement à travers les couches : les couches intermédiaires sont stables tandis que les couches finales sont très sensibles. S'appuyant sur cette observation, les auteurs proposent le Mid-Block Efficient Tuning, qui met à jour les couches intermédiaires critiques, surpassant le LoRA standard avec une surcharge de paramètres réduite.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models

RESEARCHarXiv CS.LG·il y a 11j

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Cet article examine les origines mécanistes de l'oubli catastrophique dans les grands modèles linguistiques (LLM), comparant l'apprentissage par renforcement (RL) à l'ajustement fin supervisé (SFT). Il révèle que le RL préserve plus efficacement les circuits computationnels internes, atténuant l'oubli des capacités antérieures, contrairement au SFT qui provoque une plus grande perturbation des circuits.

LLMs deep learning machine learning Catastrophic Forgetting

RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting