ARTICLEDEV.to AI·hace 19d
How I use an LLM as a translation judge
El autor usa GEMBA-MQM v2, un sistema basado en LLM, para la evaluación automática de la calidad de traducciones, categorizando errores por tipo y gravedad. A pesar de su alta correlación con anotaciones humanas, el sistema presenta ruido, requiriendo múltiples pasadas para mitigar la variabilidad de las puntuaciones.
27