RESEARCH27
A Layer-wise Analysis of Supervised Fine-Tuning
arXiv CS.LG·15 de abril de 2026
Esta pesquisa analisa o Supervised Fine-Tuning (SFT), revelando que as capacidades de seguir instruções emergem distintamente nas camadas: as camadas médias são estáveis, enquanto as finais são altamente sensíveis. Com base nisso, os autores propõem o Mid-Block Efficient Tuning, que atualiza camadas intermediárias críticas, superando o LoRA padrão com menor sobrecarga de parâmetros.
Supervised Fine-TuningLayer-wise AnalysisCatastrophic Forgettinglarge language modelsEfficient Tuning
Ler original ↗