← heapsort-ai

Code-Switching

5 items

RESEARCHHugging Face Blog·il y a 7h

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

Ce contenu évalue la capacité des agents vocaux et des systèmes de reconnaissance vocale automatique (ASR) de pointe à gérer les clients bilingues utilisant un discours alternant les codes. Il présente une analyse comparative des performances de ces technologies dans des environnements linguistiques complexes.

57
RESEARCHarXiv CS.CL·20/04/2026

Think Multilingual, Not Harder: A Data-Efficient Framework for Teaching Reasoning Models to Code-Switch

Cette recherche présente un cadre de réglage fin (fine-tuning) économe en données pour enseigner aux modèles de raisonnement à effectuer un "code-switching" efficace pour les tâches de raisonnement. Elle identifie les comportements de "code-switching" bénéfiques, s'éloignant de la vision de l'erreur, grâce à une analyse systématique de traces de raisonnement diverses.

29
RESEARCHarXiv CS.CL·il y a 20j

Benchmarking Commercial ASR Systems on Code-Switching Speech: Arabic, Persian, and German

Cette recherche présente un nouveau benchmark pour évaluer les systèmes commerciaux de reconnaissance automatique de la parole (ASR) sur le discours à alternance codique. Il évalue cinq fournisseurs d'ASR sur quatre paires de langues, y compris arabe-anglais, persan-anglais et allemand-anglais, en utilisant un pipeline de sélection de données sophistiqué en deux étapes.

27
RESEARCHarXiv CS.CL·il y a 14j

Direct Preference Optimization for English-Mandarin Code-Switching Speech Recognition in Audio LLMs

Cet article étudie les défaillances des LLM audio lors de la transcription de la parole à commutation de code anglais-mandarin, identifiant des problèmes comme l'omission de langue et la traduction. L'application de l'Optimisation par Préférence Directe (DPO) aligne les modèles pour préserver le contenu multilingue, entraînant des réductions significatives du Taux d'Erreur Mixte (MER).

27