RESEARCH27

A Layer-wise Analysis of Supervised Fine-Tuning

arXiv CS.LG·15 de abril de 2026

Esta investigación analiza el Supervised Fine-Tuning (SFT), revelando que las capacidades de seguir instrucciones emergen distintamente en las capas: las capas medias son estables, mientras que las finales son muy sensibles. Aprovechando esto, los autores proponen Mid-Block Efficient Tuning, que actualiza capas intermedias críticas, superando a LoRA estándar con menor sobrecarga de parámetros.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models Efficient Tuning

Leer original ↗