RESEARCH27
Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization
arXiv CS.LG·2. Juni 2026
Dieses Papier stellt FoLoRA vor, ein Optimierungsframework, das die Verschlechterung nicht-zielgerichteter Fähigkeiten beim Feintuning von Basismodellen adressiert. Es verwendet einen verallgemeinerten Rayleigh-Quotienten, um den Nutzen der Aufgabe und die Vergessensstrafe auszubalancieren und so Updates zur Erhaltung des Vortrainingswissens zu steuern.
Original lesen ↗