Multilingual AI

27 items

RESEARCHarXiv CS.CL·hace 1d

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Esta investigación presenta PolyFact, un conjunto de datos de preguntas y respuestas factuales multilingüe, para abordar la inconsistencia factual entre idiomas en los LLMs. Se encuentra que el aprendizaje por refuerzo a través de GRPO mejora consistentemente la recuperación factual entre idiomas y la generalización en comparación con el ajuste fino supervisado.

Multilingual AI LLMs reinforcement learning machine learning

ARTICLE↑ trendingReddit r/MachineLearning·15/4/2026

[P] Added 8 Indian languages to Chatterbox TTS via LoRA — 1.4% of parameters, no phoneme engineering [P]

Un proyecto añadió con éxito ocho idiomas indios (telugu, canarés, bengalí, tamil, malabar, maratí, gujarati e hindi) al modelo TTS Chatterbox-Multilingual utilizando adaptadores LoRA y extensión de tokenizador. Este enfoque entrenó solo el 1,4% de los parámetros del modelo, evitando la compleja ingeniería de fonemas que suele ser necesaria para cada idioma.

Multilingual AI Chatterbox TTS LoRA

ARTICLEDEV.to AI·hace 2d

Day 49: The Unseen Layers of Building Health AI for 22+ Indian Languages

Los LLM actuales, como GPT-4, tienen dificultades con consultas médicas matizadas en idiomas indios debido a un sesgo fundamental en sus datos de entrenamiento, muy inclinados hacia el inglés. GoDavaii busca cerrar esta brecha desarrollando IA de Salud avanzada para más de 22 idiomas indios, centrándose en hacer el conocimiento médico contextualmente relevante y accesible en diversos entornos lingüísticos.

Multilingual AI India AI bias Health AI

RESEARCHarXiv CS.CL·16/4/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Este estudio clasifica el sentimiento en reseñas en inglés y bengalí de aplicaciones de banca móvil gubernamentales de Bangladés, empleando un enfoque de etiquetado híbrido para 5.652 reseñas. Se encontró que los modelos tradicionales de aprendizaje automático, como Random Forest y Linear SVM, superaron significativamente al XLM-RoBERTa ajustado para esta tarea específica.

Multilingual AI machine learning natural language processing sentiment analysis

ARTICLEDEV.to AI·hace 3d

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

El artículo describe los desafíos de construir una IA de salud que realmente entienda los matices de los 22 idiomas oficiales de la India, ejemplificado por la complejidad de interpretar una frase simple. En el día 48 desde su lanzamiento, GoDavaii está abordando inmensas complejidades lingüísticas para crear una IA que trascienda las soluciones centradas en el inglés.

Multilingual AI India natural language processing Health AI

RESEARCHarXiv CS.CL·20/4/2026

Think Multilingual, Not Harder: A Data-Efficient Framework for Teaching Reasoning Models to Code-Switch

Esta investigación introduce un marco de ajuste fino (fine-tuning) eficiente en datos para enseñar a los modelos de razonamiento de lenguaje a alternar idiomas (code-switch) de manera efectiva en tareas de razonamiento. Busca identificar comportamientos beneficiosos de alternancia de idiomas, analizando sistemáticamente rastros de razonamiento diversos.

Multilingual AI Code-Switching Reasoning large language models

ARTICLEDEV.to AI·19/4/2026

Tại sao OCR đa ngôn ngữ thất bại dù đã mở rộng character set

Muchos equipos de OCR asumen que expandir el conjunto de caracteres mejora automáticamente el reconocimiento, pero este artículo revela que es una visión simplificada. El éxito del OCR multilingüe depende críticamente del entrenamiento con datos que reflejen formas de glifos reales, variaciones de fuentes, distribución de idiomas y diseños de documentos.

Multilingual AI AI development challenges OCR

RESEARCHarXiv CS.CL·14/4/2026

Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations

Esta investigación explora la mejora de la detección de lenguaje de odio translingüe utilizando datos web a gran escala y anotaciones sintéticas basadas en LLMs. Demuestra que el pre-entrenamiento continuo de modelos BERT con datos web y el ajuste fino con etiquetas sintéticas generadas por un conjunto de LLMs impulsan significativamente el rendimiento, particularmente en entornos de bajos recursos.

Multilingual AI pre-training ensemble learning Hate Speech Detection

ARTICLEDEV.to AI·23/4/2026

ERNIE Image Review: Open-Source Text-to-Image for Posters, Comics, and Bilingual Visuals

El ERNIE Image de Baidu es un modelo de texto a imagen de código abierto centrado en generar imágenes de alta calidad con texto legible y soporte bilingüe chino-inglés. Destaca en composiciones estructuradas como diseños de carteles y escenas de cómics, siendo útil para diversos flujos de trabajo creativos.

Multilingual AI Text-to-image open-source AI image generation

ARTICLEDEV.to AI·4/5/2026

The Aunty Test - what Hindi-speaking patients see when they ask Health AI in their own language

Muchos sistemas de IA de salud priorizan el inglés, lo que provoca fallos cuando los pacientes realizan consultas en sus idiomas nativos, como el hindi. GoDavaii aborda esta brecha razonando de forma nativa en 22 idiomas indios para proporcionar información médica precisa.

AI applications language models Multilingual AI healthcare AI

RESEARCHarXiv CS.CL·hace 20d

Prompting language influences diagnostic reasoning and accuracy of large language models

Esta investigación evaluó el impacto del idioma de las instrucciones en el razonamiento diagnóstico y la precisión de los grandes modelos de lenguaje (LLM) en entornos clínicos. Cuatro de los cinco modelos mostraron un mejor rendimiento en inglés, subrayando la incertidumbre sobre la fiabilidad de los LLM en otros idiomas.

Multilingual AI LLMs clinical decision support Diagnostic Accuracy

ARTICLEDEV.to AI·hace 28d

The Aunty Test - what Malayalam-speaking patients see when they ask Health AI in their own language

Este contenido resalta el fracaso de la IA de salud centrada en inglés para comprender y responder con precisión a consultas médicas en idiomas no ingleses como el malayalam. Presenta a GoDavaii como una IA capaz de razonar de forma nativa en 22 idiomas indios, abordando una brecha crítica en la accesibilidad a la atención médica para mil millones de hablantes no ingleses.

Multilingual AI global accessibility language barrier Healthcare

ARTICLEDEV.to AI·2/5/2026

The Aunty Test - what Bengali-speaking patients see when they ask Health AI in their own language

Este contenido expone las limitaciones de la IA de Salud 'English-first', que falla al proporcionar consejos precisos para consultas en idiomas como el bengalí debido a capas de traducción deficientes. Destaca a GoDavaii como una IA que razona de forma nativa en 22 idiomas indios, ofreciendo asistencia médica localizada superior.

Multilingual AI Healthcare localization

ARTICLEDEV.to AI·hace 16d

How Google I/O 2026 Inspired Me to Start Building a Telugu Jarvis AI

Inspirado por Google I/O 2026, el autor tiene la intención de desarrollar un asistente de IA priorizando el telugu. Esta iniciativa busca hacer que la IA sea más accesible para los estudiantes en India que prefieren aprender y comunicarse en idiomas regionales, fomentando un aprendizaje más rápido y confianza.

AI accessibility Multilingual AI India learning

ARTICLEDEV.to AI·2/5/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Este artículo subraya cómo la mayoría de las IAs de salud, diseñadas primero en inglés, fallan al manejar consultas médicas en idiomas locales como el maratí. Destaca la necesidad de IAs que razonen nativamente en múltiples idiomas para proporcionar orientación precisa, en lugar de depender de capas de traducción o "chapados" localizados.

language models Multilingual AI AI bias healthcare AI

DOCDEV.to AI·24/4/2026

Build a Multilingual AI Voice Bot: Auto-Detect and Respond in the Caller's Language

Este contenido detalla cómo construir un bot de voz con IA multilingüe que detecta y responde automáticamente en el idioma de la persona que llama. Cubre las tres capas tecnológicas esenciales (STT, LLM, TTS) necesarias para una experiencia conversacional natural.

language detection Multilingual AI AI voice bot Speech-to-Text

ARTICLEDEV.to AI·7/5/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

El contenido aborda cómo la IA de salud centrada en el inglés tiene dificultades para procesar consultas en idiomas nativos como el marathi, lo que lleva a respuestas imprecisas. Destaca la necesidad de una IA que pueda razonar de forma nativa en varios idiomas para un soporte sanitario eficaz.

Multilingual AI language barrier localization Health AI

ARTICLEHugging Face Blog·17/4/2026

Building a Fast Multilingual OCR Model with Synthetic Data

Este contenido trata sobre la construcción de un modelo de Reconocimiento Óptico de Caracteres (OCR) rápido y multilingüe. La metodología propuesta utiliza datos sintéticos para el entrenamiento y la optimización del modelo.

synthetic data Multilingual AI machine learning OCR

RESEARCHarXiv CS.CL·1/5/2026

Cross-Lingual Response Consistency in Large Language Models: An ILR-Informed Evaluation of Claude Across Six Languages

Este estudio introduce un marco de evaluación basado en ILR para analizar la consistencia de respuestas interlingüísticas de Claude (Sonnet 4.6) en seis idiomas. A través de métricas cuantitativas y evaluación cualitativa, se identifican variaciones como diferencias en la longitud de las respuestas y divergencias superficiales en grupos creativos.

Multilingual AI LLMs AI evaluation

RESEARCHarXiv CS.CL·hace 26d

Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation

Los grandes modelos de lenguaje multilingües (MLLM) a menudo muestran un comportamiento inconsistente en cuanto a la identidad cultural entre idiomas. Para mitigar esto, los investigadores proponen una nueva métrica y un marco de alineación basado en el consenso, C-3PO, que mejora notablemente la consistencia cultural interlingüística.

Multilingual AI LLMs AI alignment Cultural Bias