RESEARCH27

A Layer-wise Analysis of Supervised Fine-Tuning

arXiv CS.LG·15 de abril de 2026

Esta pesquisa analisa o Supervised Fine-Tuning (SFT), revelando que as capacidades de seguir instruções emergem distintamente nas camadas: as camadas médias são estáveis, enquanto as finais são altamente sensíveis. Com base nisso, os autores propõem o Mid-Block Efficient Tuning, que atualiza camadas intermediárias críticas, superando o LoRA padrão com menor sobrecarga de parâmetros.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models Efficient Tuning

Ler original ↗