← heapsort-ai

Multilingual AI

27 items

RESEARCHarXiv CS.CL·vor 1T

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Diese Forschung stellt PolyFact vor, einen mehrsprachigen faktischen QA-Datensatz, um die sprachübergreifende faktische Inkonsistenz in LLMs zu beheben. Es wird festgestellt, dass Reinforcement Learning mittels GRPO die sprachübergreifende faktenbasierte Wiedergabe und Generalisierung im Vergleich zu supervised Fine-Tuning konsistent verbessert.

60
ARTICLE↑ trendingReddit r/MachineLearning·4/15/2026

[P] Added 8 Indian languages to Chatterbox TTS via LoRA — 1.4% of parameters, no phoneme engineering [P]

Ein Projekt hat erfolgreich acht indische Sprachen (Telugu, Kannada, Bengali, Tamil, Malayalam, Marathi, Gujarati und Hindi) zum Chatterbox-Multilingual-TTS-Modell hinzugefügt, indem es LoRA-Adapter und Tokenizer-Erweiterung nutzte. Dieser Ansatz trainierte nur 1,4 % der Modellparameter und vermied so das komplexe Phonem-Engineering, das normalerweise für jede Sprache erforderlich ist.

43
ARTICLEDEV.to AI·vor 2T

Day 49: The Unseen Layers of Building Health AI for 22+ Indian Languages

Aktuelle LLMs wie GPT-4 haben Schwierigkeiten mit nuancierten medizinischen Anfragen in indischen Sprachen, bedingt durch eine grundlegende Voreingenommenheit in ihren englischlastigen Trainingsdaten. GoDavaii zielt darauf ab, diese Lücke zu schließen, indem es fortschrittliche Gesundheits-KI für über 22 indische Sprachen entwickelt, wobei der Fokus darauf liegt, medizinisches Wissen in verschiedenen sprachlichen Kontexten relevant und zugänglich zu machen.

34
RESEARCHarXiv CS.CL·4/16/2026

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

Diese Studie klassifiziert die Stimmung in englischen und bengalischen Rezensionen von mobilen Banking-Apps der bangladeschischen Regierung, basierend auf einem hybriden Etikettierungsansatz für 5.652 Rezensionen. Es wurde festgestellt, dass traditionelle Machine-Learning-Modelle wie Random Forest und Linear SVM XLM-RoBERTa für diese spezifische Aufgabe deutlich übertrafen.

31
ARTICLEDEV.to AI·vor 3T

Day 48 of GoDavaii: Building Health AI for 22 Indian Languages - Why It's Harder Than You Think

Der Artikel beschreibt die Herausforderungen beim Aufbau einer Gesundheits-KI, die die Nuancen der 22 offiziellen Sprachen Indiens wirklich versteht, veranschaulicht durch die Komplexität der Interpretation eines einfachen Satzes. Am 48. Tag nach dem Start befasst sich GoDavaii mit immensen sprachlichen Komplexitäten, um eine KI zu schaffen, die über englischzentrierte Lösungen hinausgeht.

30
RESEARCHarXiv CS.CL·4/20/2026

Think Multilingual, Not Harder: A Data-Efficient Framework for Teaching Reasoning Models to Code-Switch

Diese Forschung stellt ein dateneffizientes Fine-Tuning-Framework vor, um Reasoning-Modellen beizubringen, effektiv Code-Switching für Denkaufgaben zu nutzen. Es identifiziert vorteilhafte Code-Switching-Verhaltensweisen durch die systematische Analyse diverser Reasoning-Spuren, statt dies als Fehler zu betrachten.

29
ARTICLEDEV.to AI·4/19/2026

Tại sao OCR đa ngôn ngữ thất bại dù đã mở rộng character set

Viele OCR-Teams gehen davon aus, dass die Erweiterung des Zeichensatzes die Erkennung automatisch verbessert, doch dieser Artikel zeigt, dass dies eine vereinfachte Ansicht ist. Erfolgreiches mehrsprachiges OCR hängt entscheidend vom Training mit Daten ab, die tatsächliche Glyphenformen, Schriftartvariationen, Sprachverteilung und Dokumentenlayouts widerspiegeln.

28
RESEARCHarXiv CS.CL·4/14/2026

Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations

Diese Forschung untersucht die Verbesserung der mehrsprachigen Hassrede-Erkennung durch die Nutzung großer unmarkierter Webdaten und LLM-basierter synthetischer Annotationen. Sie zeigt, dass das fortgesetzte Vortraining von BERT-Modellen auf Webdaten und das Feinabstimmen mit synthetischen Labels, die von einem LLM-Ensemble generiert wurden, die Leistung erheblich steigert, insbesondere in ressourcenarmen Umgebungen.

28
ARTICLEDEV.to AI·4/23/2026

ERNIE Image Review: Open-Source Text-to-Image for Posters, Comics, and Bilingual Visuals

Baidus ERNIE Image ist ein Open-Source-Text-zu-Bild-Modell, das sich auf die Generierung hochwertiger Visuals mit lesbarem Text und zweisprachiger chinesisch-englischer Unterstützung konzentriert. Es excelled in strukturierten Kompositionen wie Poster-Layouts und Comic-Szenen und ist nützlich für vielfältige kreative Arbeitsabläufe.

28
RESEARCHarXiv CS.CL·vor 20T

Prompting language influences diagnostic reasoning and accuracy of large language models

Diese Forschung bewertete den Einfluss der Prompt-Sprache auf die diagnostische Argumentation und Genauigkeit großer Sprachmodelle (LLMs) im klinischen Umfeld. Vier von fünf Modellen zeigten eine bessere Leistung auf Englisch, was die Unsicherheit hinsichtlich der Zuverlässigkeit von LLMs in anderen Sprachen hervorhebt.

27
ARTICLEDEV.to AI·vor 28T

The Aunty Test - what Malayalam-speaking patients see when they ask Health AI in their own language

Dieser Inhalt beleuchtet das Versagen von englischzentrierter Gesundheits-KI, medizinische Anfragen in nicht-englischen Sprachen wie Malayalam präzise zu verstehen und zu beantworten. Er stellt GoDavaii als eine KI vor, die in 22 indischen Sprachen nativ denken kann, und schließt damit eine kritische Lücke in der Gesundheitsversorgung für eine Milliarde Nicht-Englischsprachige.

27
ARTICLEDEV.to AI·5/2/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Dieser Artikel beleuchtet, wie die meisten englischsprachigen KI-Gesundheitssysteme bei medizinischen Anfragen in lokalen Sprachen wie Marathi versagen. Er betont die Notwendigkeit von KI, die nativ in mehreren Sprachen argumentiert, anstatt sich auf Übersetzungs- oder lokalisierungsbasierte Ansätze zu verlassen, um genaue Gesundheitsberatung zu bieten.

27
RESEARCHarXiv CS.CL·5/1/2026

Cross-Lingual Response Consistency in Large Language Models: An ILR-Informed Evaluation of Claude Across Six Languages

Dieses Papier stellt einen ILR-informierten Bewertungsrahmen vor, um die sprachübergreifende Antwortkonsistenz von Claude (Sonnet 4.6) in sechs Sprachen zu evaluieren. Die quantitative und qualitative Analyse zeigt sprachspezifische Variationen auf, wie z.B. Unterschiede in der Antwortlänge und oberflächliche Divergenzen in kreativen Clustern.

27
RESEARCHarXiv CS.CL·vor 26T

Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation

Mehrsprachige große Sprachmodelle (MLLMs) zeigen oft inkonsistentes Verhalten bei kulturellen Identitäten, wenn die Prompt-Sprache wechselt. Zur Minderung dieses Problems führen Forscher eine neue Metrik und ein konsensbasiertes Ausrichtungs-Framework, C-3PO, ein, das die sprachübergreifende kulturelle Konsistenz signifikant verbessert.

27