heapsort
RESEARCH27

Rotation-Preserving Supervised Fine-Tuning

arXiv CS.LG·13. Mai 2026

Diese Arbeit führt "Rotation-Preserving Supervised Fine-Tuning" (RPSFT) ein, um die Out-of-Domain-Generalisierung bei großen Sprachmodellen zu verbessern. Es bestraft Änderungen in vorab trainierten singulären Unterräumen und dient als effizienter Proxy für Fisher-sensitive Richtungen, wobei es Standard-SFT-Baselines übertrifft.

Original lesen