← heapsort-ai

MQM

1 items

ARTICLEDEV.to AI·18d atrás

How I use an LLM as a translation judge

O autor emprega o GEMBA-MQM v2, um sistema baseado em LLM, para avaliar automaticamente a qualidade de traduções, classificando erros por tipo e gravidade. Embora demonstre alta correlação com avaliações humanas, o sistema apresenta variabilidade, sendo necessárias múltiplas passagens para mitigar a inconsistência das pontuações.

27