ARTICLE27

How I use an LLM as a translation judge

DEV.to AI·22 de maio de 2026

O autor emprega o GEMBA-MQM v2, um sistema baseado em LLM, para avaliar automaticamente a qualidade de traduções, classificando erros por tipo e gravidade. Embora demonstre alta correlação com avaliações humanas, o sistema apresenta variabilidade, sendo necessárias múltiplas passagens para mitigar a inconsistência das pontuações.

Translation MQM benchmarking quality evaluation LLM

Ler original ↗