← heapsort-ai

Code-Switching

5 items

RESEARCHarXiv CS.CL·20/4/2026

Think Multilingual, Not Harder: A Data-Efficient Framework for Teaching Reasoning Models to Code-Switch

Esta investigación introduce un marco de ajuste fino (fine-tuning) eficiente en datos para enseñar a los modelos de razonamiento de lenguaje a alternar idiomas (code-switch) de manera efectiva en tareas de razonamiento. Busca identificar comportamientos beneficiosos de alternancia de idiomas, analizando sistemáticamente rastros de razonamiento diversos.

29
RESEARCHarXiv CS.CL·hace 20d

Benchmarking Commercial ASR Systems on Code-Switching Speech: Arabic, Persian, and German

Esta investigación introduce un nuevo benchmark para evaluar sistemas comerciales de Reconocimiento Automático de Voz (ASR) en habla con cambio de código. Evalúa a cinco proveedores de ASR en cuatro pares de idiomas, incluyendo árabe-inglés, persa-inglés y alemán-inglés, utilizando un sofisticado pipeline de selección de datos en dos etapas.

27
RESEARCHarXiv CS.CL·hace 14d

Direct Preference Optimization for English-Mandarin Code-Switching Speech Recognition in Audio LLMs

Este artículo investiga fallas en los LLM de Audio al transcribir el habla con cambio de código inglés-mandarín, identificando problemas como la omisión de idioma y la traducción. La aplicación de la Optimización de Preferencia Directa (DPO) alinea los modelos para preservar el contenido en idiomas mixtos, lo que lleva a reducciones significativas en la Tasa de Error Mixta (MER).

27