RESEARCH27
Rotation-Preserving Supervised Fine-Tuning
arXiv CS.LG·13 de maio de 2026
Este artigo propõe o "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) para melhorar a generalização fora do domínio em modelos de linguagem grandes. Ele penaliza mudanças em subespaços singulares pré-treinados, oferecendo um proxy eficiente para direções sensíveis a Fisher e superando baselines SFT padrão.
Ler original ↗