ARTICLE27
How I use an LLM as a translation judge
DEV.to AI·22 de maio de 2026
O autor emprega o GEMBA-MQM v2, um sistema baseado em LLM, para avaliar automaticamente a qualidade de traduções, classificando erros por tipo e gravidade. Embora demonstre alta correlação com avaliações humanas, o sistema apresenta variabilidade, sendo necessárias múltiplas passagens para mitigar a inconsistência das pontuações.
Ler original ↗