Why Fine-Tuning Encourages Hallucinations and How to Fix It
Große Sprachmodelle neigen dazu, faktisch inkorrekte Aussagen zu halluzinieren, ein Problem, das durch überwachtes Fine-Tuning (SFT) verstärkt wird, welches das vorab erworbene Wissen abbaut. Diese Forschung schlägt eine selbst-destillationsbasierte SFT-Methode vor, inspiriert vom kontinuierlichen Lernen, um Halluzinationen durch die Regularisierung der Ausgabe-Distributionsdrift zu mindern, während neue Fakten effektiv gelernt werden.