← heapsort-ai

multilingual LLMs

2 items

RESEARCHarXiv CS.CL·il y a 25j

Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey

Cet article étudie l'efficacité des méthodes de fusion de vecteurs pour l'édition de connaissances multilingues (MKE) dans les Grands Modèles de Langage, en se concentrant sur la réduction des interférences entre les modifications spécifiques à chaque langue. Évaluant six variantes de fusion avec deux LLM, deux méthodes d'édition et 12 langues sur le benchmark MzsRE, il conclut que la sommation vectorielle avec covariance partagée est la stratégie globale la plus fiable.

27
RESEARCHarXiv CS.CL·il y a 8j

Cross-Lingual Steering for Figurative Language Generation

Cette recherche examine si les signaux internes pilotant la génération de langage figuré dans les grands modèles de langage multilingues sont spécifiques à la langue ou réutilisables. L'étude a montré que les directions des catégories figuratives se transfèrent robustement entre les langues, indiquant une composante partagée pour cette capacité.

27