RESEARCH27
A Layer-wise Analysis of Supervised Fine-Tuning
arXiv CS.LG·15 de abril de 2026
Esta investigación analiza el Supervised Fine-Tuning (SFT), revelando que las capacidades de seguir instrucciones emergen distintamente en las capas: las capas medias son estables, mientras que las finales son muy sensibles. Aprovechando esto, los autores proponen Mid-Block Efficient Tuning, que actualiza capas intermedias críticas, superando a LoRA estándar con menor sobrecarga de parámetros.
Supervised Fine-TuningLayer-wise AnalysisCatastrophic Forgettinglarge language modelsEfficient Tuning
Leer original ↗