← heapsort-ai

multilingual LLMs

2 items

RESEARCHarXiv CS.CL·hace 25d

Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey

Este artículo investiga la eficacia de los métodos de fusión de vectores para la edición de conocimiento multilingüe (MKE) en Grandes Modelos de Lenguaje, centrándose en reducir la interferencia entre ediciones específicas de idiomas. Evaluando seis variantes de fusión con dos LLM, dos métodos de edición y 12 idiomas en el benchmark MzsRE, encuentra que la suma vectorial con covarianza compartida es la estrategia más fiable.

27
RESEARCHarXiv CS.CL·hace 8d

Cross-Lingual Steering for Figurative Language Generation

Esta investigación explora si las señales internas que impulsan la generación de lenguaje figurado en grandes modelos de lenguaje multilingües son específicas del idioma o reutilizables. El estudio demostró que las direcciones de categorías figuradas se transfieren de manera robusta entre idiomas, lo que sugiere un componente compartido para esta capacidad.

27