MQM — artigos, notícias e pesquisas de IA

ARTICLEDEV.to AI·18d atrás

How I use an LLM as a translation judge

O autor emprega o GEMBA-MQM v2, um sistema baseado em LLM, para avaliar automaticamente a qualidade de traduções, classificando erros por tipo e gravidade. Embora demonstre alta correlação com avaliações humanas, o sistema apresenta variabilidade, sendo necessárias múltiplas passagens para mitigar a inconsistência das pontuações.

Translation MQM Benchmarking quality evaluation