ARTICLE27

How I use an LLM as a translation judge

DEV.to AI·22 de mayo de 2026

El autor usa GEMBA-MQM v2, un sistema basado en LLM, para la evaluación automática de la calidad de traducciones, categorizando errores por tipo y gravedad. A pesar de su alta correlación con anotaciones humanas, el sistema presenta ruido, requiriendo múltiples pasadas para mitigar la variabilidad de las puntuaciones.

Translation MQM benchmarking quality evaluation LLM

Leer original ↗