ARTICLEDEV.to AI·18d atrás
How I use an LLM as a translation judge
O autor emprega o GEMBA-MQM v2, um sistema baseado em LLM, para avaliar automaticamente a qualidade de traduções, classificando erros por tipo e gravidade. Embora demonstre alta correlação com avaliações humanas, o sistema apresenta variabilidade, sendo necessárias múltiplas passagens para mitigar a inconsistência das pontuações.
27