← heapsort-ai

Catastrophic Forgetting

5 items

RESEARCH↑ trendingReddit r/MachineLearning·27d atrás

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Modelos de linguagem grandes (LLMs) enfrentam o desafio do esquecimento catastrófico e perda de plasticidade ao atualizar seus parâmetros para tarefas específicas. Este trabalho introduz um framework de aprendizado "rápido-lento" para LLMs, usando parâmetros do modelo como pesos lentos e contexto otimizado como pesos rápidos para adaptar-se de forma eficiente sem comprometer o raciocínio geral.

42
RESEARCHarXiv CS.LG·15/04/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Esta pesquisa analisa o Supervised Fine-Tuning (SFT), revelando que as capacidades de seguir instruções emergem distintamente nas camadas: as camadas médias são estáveis, enquanto as finais são altamente sensíveis. Com base nisso, os autores propõem o Mid-Block Efficient Tuning, que atualiza camadas intermediárias críticas, superando o LoRA padrão com menor sobrecarga de parâmetros.

27
RESEARCHarXiv CS.LG·11d atrás

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Este artigo investiga as origens mecanicistas do esquecimento catastrófico em Grandes Modelos de Linguagem (LLMs), comparando o Aprendizado por Reforço (RL) com o Ajuste Fino Supervisionado (SFT). Ele revela que o RL preserva circuitos computacionais internos de forma mais eficaz, mitigando o esquecimento de capacidades anteriores, ao contrário do SFT que causa maior interrupção nos circuitos.

27
RESEARCHarXiv CS.CL·06/05/2026

Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning

Sparse Memory Finetuning (SMF) aborda o esquecimento catastrófico em modelos de linguagem pré-treinados, atualizando apenas um pequeno subconjunto de linhas de memória. Experimentos demonstram que o SMF melhora o desempenho em uma tarefa de exame médico, mitigando substancialmente o esquecimento em comparação com LoRA e o ajuste fino completo.

27