heapsort
RESEARCH27

Rotation-Preserving Supervised Fine-Tuning

arXiv CS.LG·13 mai 2026

Cet article présente le "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) pour améliorer la généralisation hors domaine dans les grands modèles linguistiques. Il pénalise les changements dans les sous-espaces singuliers pré-entraînés, agissant comme un proxy efficace pour les directions sensibles à Fisher et surpassant les bases SFT standards.

Lire l'original