RESEARCH27
Rotation-Preserving Supervised Fine-Tuning
arXiv CS.LG·13 de mayo de 2026
Este artículo propone el "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) para mejorar la generalización fuera del dominio en modelos de lenguaje grandes. Penaliza los cambios en los subespacios singulares preentrenados, ofreciendo un proxy eficiente para las direcciones sensibles de Fisher y superando las líneas base de SFT estándar.
Leer original ↗