heapsort
RESEARCH27

A Layer-wise Analysis of Supervised Fine-Tuning

arXiv CS.LG·15 de abril de 2026

Esta investigación analiza el Supervised Fine-Tuning (SFT), revelando que las capacidades de seguir instrucciones emergen distintamente en las capas: las capas medias son estables, mientras que las finales son muy sensibles. Aprovechando esto, los autores proponen Mid-Block Efficient Tuning, que actualiza capas intermedias críticas, superando a LoRA estándar con menor sobrecarga de parámetros.

Leer original