RESEARCH27
Rotation-Preserving Supervised Fine-Tuning
arXiv CS.LG·13 mai 2026
Cet article présente le "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) pour améliorer la généralisation hors domaine dans les grands modèles linguistiques. Il pénalise les changements dans les sous-espaces singuliers pré-entraînés, agissant comme un proxy efficace pour les directions sensibles à Fisher et surpassant les bases SFT standards.
Lire l'original ↗