← heapsort-ai

Catastrophic Forgetting

5 items

RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Les grands modèles linguistiques (LLM) sont confrontés à l'oubli catastrophique et à la perte de plasticité lors de la mise à jour de leurs paramètres pour des tâches spécifiques. Ce travail introduit un cadre d'apprentissage "rapide-lent" pour les LLM, utilisant les paramètres du modèle comme poids lents et le contexte optimisé comme poids rapides pour s'adapter efficacement sans compromettre le raisonnement général.

42
RESEARCHarXiv CS.LG·15/04/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Cette recherche analyse le Supervised Fine-Tuning (SFT), révélant que les capacités de suivi des instructions émergent distinctement à travers les couches : les couches intermédiaires sont stables tandis que les couches finales sont très sensibles. S'appuyant sur cette observation, les auteurs proposent le Mid-Block Efficient Tuning, qui met à jour les couches intermédiaires critiques, surpassant le LoRA standard avec une surcharge de paramètres réduite.

27
RESEARCHarXiv CS.LG·il y a 11j

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Cet article examine les origines mécanistes de l'oubli catastrophique dans les grands modèles linguistiques (LLM), comparant l'apprentissage par renforcement (RL) à l'ajustement fin supervisé (SFT). Il révèle que le RL préserve plus efficacement les circuits computationnels internes, atténuant l'oubli des capacités antérieures, contrairement au SFT qui provoque une plus grande perturbation des circuits.

27
RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Le Sparse Memory Finetuning (SMF) résout le problème de l'oubli catastrophique dans les modèles de langage pré-entraînés en mettant à jour uniquement un petit sous-ensemble de lignes de mémoire. Les expériences montrent que le SMF améliore les performances sur une tâche d'examen médical tout en atténuant considérablement l'oubli par rapport à LoRA et au réglage fin complet.

27