MQM — artículos, noticias e investigación de IA

ARTICLEDEV.to AI·hace 19d

How I use an LLM as a translation judge

El autor usa GEMBA-MQM v2, un sistema basado en LLM, para la evaluación automática de la calidad de traducciones, categorizando errores por tipo y gravedad. A pesar de su alta correlación con anotaciones humanas, el sistema presenta ruido, requiriendo múltiples pasadas para mitigar la variabilidad de las puntuaciones.

Translation MQM benchmarking quality evaluation