← heapsort-ai

machine translation

8 items

RESEARCHarXiv CS.CL·14/04/2026

Should We be Pedantic About Reasoning Errors in Machine Translation?

Cette étude identifie et quantifie les erreurs de raisonnement dans la traduction automatique sur plusieurs paires de langues, en utilisant un protocole d'annotation automatisé. Les expériences avec des interventions sur les traces de raisonnement suggèrent que des corrections fortes améliorent la résolution des erreurs, bien qu'avec des gains mitigés en qualité de traduction.

28
RESEARCHarXiv CS.CL·il y a 22j

Fluency and Faithfulness in Human and Machine Literary Translation

Cette étude analyse l'équilibre entre fluidité et fidélité dans la traduction littéraire, comparant les traductions humaines, Google Translate et TranslateGemma de 106 romans dans 16 langues. Elle révèle une corrélation négative constante entre fluidité et fidélité, notée pour les traductions humaines et Google Translate, et indique que la longueur des segments influence l'évaluation automatique.

28
RESEARCHarXiv CS.CL·22/04/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Cet article propose une nouvelle approche d'apprentissage en contexte pour la traduction automatique du copte vers l'anglais à faibles ressources, en augmentant les entrées avec des informations syntaxiques issues des analyses de Dépendances Universelles. La combinaison de ces données syntaxiques avec des glossaires basés sur des dictionnaires permet des gains significatifs et établit un nouvel état de l'art.

27
RESEARCHarXiv CS.CL·07/05/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Cet article étudie systématiquement l'impact des vocabulaires conjoints et disjoints sur le transfert de connaissances en traduction automatique neuronale multilingue (MNMT). Les expériences montrent que des chevauchements de vocabulaire étendus, la parenté linguistique et la correspondance de domaine entraînent de meilleures performances, même dans des configurations hors domaine.

27
RESEARCHarXiv CS.CL·06/04/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27