RESEARCH27

Rotation-Preserving Supervised Fine-Tuning

arXiv CS.LG·13 de mayo de 2026

Este artículo propone el "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) para mejorar la generalización fuera del dominio en modelos de lenguaje grandes. Penaliza los cambios en los subespacios singulares preentrenados, ofreciendo un proxy eficiente para las direcciones sensibles de Fisher y superando las líneas base de SFT estándar.

neural networks research machine learning Fine-tuning LLM

Leer original ↗