← heapsort-ai

multilingual LLMs

2 items

RESEARCHarXiv CS.CL·vor 26T

Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey

Dieses Papier untersucht die Wirksamkeit von Vektor-Fusionsmethoden für die mehrsprachige Wissensbearbeitung (MKE) in großen Sprachmodellen, wobei der Fokus auf der Reduzierung von Interferenzen zwischen sprachspezifischen Bearbeitungen liegt. Durch die Bewertung von sechs Fusionsvarianten mit zwei populären Backbone-LLMs, zwei Wissensbearbeitungsmethoden und 12 Sprachen auf dem MzsRE-Benchmark wird festgestellt, dass die Vektorsumme mit geteilter Kovarianz die insgesamt zuverlässigste Strategie ist.

27
RESEARCHarXiv CS.CL·vor 9T

Cross-Lingual Steering for Figurative Language Generation

Diese Forschung untersucht, ob interne Signale, die die Erzeugung figurativer Sprache in mehrsprachigen großen Sprachmodellen steuern, sprachspezifisch oder über Sprachen hinweg wiederverwendbar sind. Die Studie zeigte, dass Richtungen für figurative Kategorien innerhalb ihrer eigenen Sprache zuverlässig steuern und sich vor allem robust über Sprachen hinweg übertragen lassen, was auf eine gemeinsame Komponente für diese Fähigkeit hindeutet.

27