← heapsort-ai

machine translation

8 items

RESEARCHarXiv CS.CL·4/14/2026

Should We be Pedantic About Reasoning Errors in Machine Translation?

Diese Forschung identifiziert und quantifiziert Schlussfolgerungsfehler in der maschinellen Übersetzung über mehrere Sprachpaare hinweg, unter Verwendung eines automatisierten Annotationsprotokolls. Experimente mit Interventionen an Schlussfolgerungsspuren deuten darauf hin, dass starke Korrekturen die Fehlerauflösung verbessern, wenngleich mit gemischten Ergebnissen bei der Gesamtübersetzungsqualität.

28
RESEARCHarXiv CS.CL·vor 23T

Fluency and Faithfulness in Human and Machine Literary Translation

Diese Studie untersucht das Gleichgewicht zwischen Flüssigkeit und Treue in der literarischen Übersetzung, indem sie menschliche Übersetzungen, Google Translate und TranslateGemma von 106 Romanen in 16 Sprachen vergleicht. Sie zeigt eine konsistente negative Korrelation zwischen Flüssigkeit und Treue, die bei menschlichen und Google Translate Übersetzungen stärker ist, und betont, dass die Segmentlänge für die automatische Bewertung wichtig ist.

28
RESEARCHarXiv CS.CL·4/22/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Dieses Papier stellt einen neuen In-Context-Lernansatz für die maschinelle Übersetzung aus dem Koptischen ins Englische für ressourcenarme Sprachen vor, der Eingaben mit syntaktischen Informationen aus Universal Dependencies-Parses erweitert. Die Kombination dieser syntaktischen Daten mit wörterbuchbasierten Glossaren erzielt signifikante Leistungssteigerungen und erreicht den aktuellen Stand der Technik.

27
RESEARCHarXiv CS.CL·5/7/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Diese Arbeit untersucht systematisch den Einfluss von gemeinsamen und getrennten Vokabularen auf den Wissenstransfer in der mehrsprachigen neuronalen Maschinenübersetzung (MNMT). Experimente zeigen, dass umfangreiche Vokabularüberschneidungen, Sprachverwandtschaft und Domänenübereinstimmung zu besseren Ergebnissen führen, selbst in Out-of-Domain-Setups.

27
RESEARCHarXiv CS.CL·4/6/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27