Catastrophic Forgetting

5 items

RESEARCH↑ trendingReddit r/MachineLearning·27d atrás

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Modelos de linguagem grandes (LLMs) enfrentam o desafio do esquecimento catastrófico e perda de plasticidade ao atualizar seus parâmetros para tarefas específicas. Este trabalho introduz um framework de aprendizado "rápido-lento" para LLMs, usando parâmetros do modelo como pesos lentos e contexto otimizado como pesos rápidos para adaptar-se de forma eficiente sem comprometer o raciocínio geral.

LLMs learning Catastrophic Forgetting AI Research

RESEARCHDEV.to AI·14/04/2026

Don't forget, there is more than forgetting: new metrics for Continual Learning

Este conteúdo aborda novas métricas para a Aprendizagem Contínua, expandindo a avaliação para além da prevenção do esquecimento catastrófico. Propõe uma visão mais abrangente para medir o desempenho de modelos de IA em cenários de aprendizagem sequencial.

AI metrics evaluation machine learning Catastrophic Forgetting

RESEARCHarXiv CS.LG·15/04/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Esta pesquisa analisa o Supervised Fine-Tuning (SFT), revelando que as capacidades de seguir instruções emergem distintamente nas camadas: as camadas médias são estáveis, enquanto as finais são altamente sensíveis. Com base nisso, os autores propõem o Mid-Block Efficient Tuning, que atualiza camadas intermediárias críticas, superando o LoRA padrão com menor sobrecarga de parâmetros.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models

RESEARCHarXiv CS.LG·11d atrás

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Este artigo investiga as origens mecanicistas do esquecimento catastrófico em Grandes Modelos de Linguagem (LLMs), comparando o Aprendizado por Reforço (RL) com o Ajuste Fino Supervisionado (SFT). Ele revela que o RL preserva circuitos computacionais internos de forma mais eficaz, mitigando o esquecimento de capacidades anteriores, ao contrário do SFT que causa maior interrupção nos circuitos.

LLMs deep learning machine learning Catastrophic Forgetting

RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda o esquecimento catastrófico em modelos de linguagem pré-treinados, atualizando apenas um pequeno subconjunto de linhas de memória. Experimentos demonstram que o SMF melhora o desempenho em uma tarefa de exame médico, mitigando substancialmente o esquecimento em comparação com LoRA e o ajuste fino completo.

Finetuning language models Sparse Memory Finetuning Catastrophic Forgetting