Catastrophic Forgetting

5 items

RESEARCH↑ trendingReddit r/MachineLearning·hace 27d

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Los grandes modelos de lenguaje (LLM) enfrentan el olvido catastrófico y la pérdida de plasticidad al actualizar sus parámetros para tareas específicas. Este trabajo introduce un marco de aprendizaje "rápido-lento" para LLM, utilizando los parámetros del modelo como pesos lentos y el contexto optimizado como pesos rápidos para adaptarse eficientemente sin comprometer el razonamiento general.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHDEV.to AI·14/4/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Este contenido presenta nuevas métricas para el Aprendizaje Continuo, ampliando la evaluación más allá de la prevención del olvido catastrófico. Propone una visión más completa para medir el rendimiento de los modelos de IA en escenarios de aprendizaje secuencial.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·15/4/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Esta investigación analiza el Supervised Fine-Tuning (SFT), revelando que las capacidades de seguir instrucciones emergen distintamente en las capas: las capas medias son estables, mientras que las finales son muy sensibles. Aprovechando esto, los autores proponen Mid-Block Efficient Tuning, que actualiza capas intermedias críticas, superando a LoRA estándar con menor sobrecarga de parámetros.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models

RESEARCHarXiv CS.LG·hace 11d

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Este artículo investiga los orígenes mecanicistas del olvido catastrófico en Grandes Modelos de Lenguaje (LLMs), comparando el Aprendizaje por Refuerzo (RL) con el Ajuste Fino Supervisado (SFT). Revela que el RL preserva los circuitos computacionales internos de manera más efectiva, mitigando el olvido de capacidades anteriores, a diferencia del SFT que causa mayor interrupción en los circuitos.

LLMs deep learning machine learning Catastrophic Forgetting

RESEARCHarXiv CS.CL·6/5/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda el olvido catastrófico en modelos de lenguaje preentrenados actualizando solo un pequeño subconjunto de filas de memoria. Los experimentos muestran que SMF mejora el rendimiento en una tarea de examen médico y mitiga sustancialmente el olvido en comparación con LoRA y el ajuste fino completo.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting