← heapsort-ai

machine translation

8 items

RESEARCHarXiv CS.CL·14/04/2026

Should We be Pedantic About Reasoning Errors in Machine Translation?

Este estudo identifica e quantifica erros de raciocínio na tradução automática em múltiplos pares de idiomas, utilizando um protocolo de anotação automatizado. As intervenções nos traços de raciocínio mostram que correções fortes melhoram a resolução de erros, embora com ganhos mistos na qualidade geral da tradução.

28
RESEARCHarXiv CS.CL·22d atrás

Fluency and Faithfulness in Human and Machine Literary Translation

Esta pesquisa investiga o equilíbrio entre fluência e fidelidade na tradução literária, comparando o desempenho de humanos, Google Translate e TranslateGemma em 106 romances em 16 idiomas. Os resultados mostram uma correlação negativa consistente entre fluência e fidelidade, destacando que o comprimento do segmento é crucial para a avaliação automática.

28
RESEARCHarXiv CS.CL·22/04/2026

Syntax as a Rosetta Stone: Universal Dependencies for In-Context Coptic Translation

Este artigo propõe uma nova abordagem de aprendizado em contexto para tradução automática de copta para inglês em baixa-recurso, utilizando aumento sintático de análises de Dependências Universais. Embora a informação sintática sozinha seja menos eficaz que glossários baseados em dicionário, a combinação de ambos resulta em ganhos significativos e alcança o estado da arte.

27
RESEARCHarXiv CS.CL·07/05/2026

The Impact of Vocabulary Overlaps on Knowledge Transfer in Multilingual Machine Translation

Este artigo investiga sistematicamente o impacto de vocabulários conjuntos e disjuntos na transferência de conhecimento na tradução automática neural multilíngue (MNMT). Experimentos demonstram que amplas sobreposições de vocabulário, similaridade linguística e correspondência de domínio resultam em melhor desempenho, mesmo em configurações fora do domínio.

27
RESEARCHarXiv CS.CL·06/04/2026

An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages

Este estudo empírico investiga o aprendizado em contexto (ICL) de muitos exemplos para tradução automática de inglês para dez idiomas de baixo recurso. Os achados mostram que o ICL se torna mais eficaz com o aumento do número de exemplos, e a recuperação baseada em BM25 melhora substancialmente a eficiência dos dados.

27