ARTICLE27
How I use an LLM as a translation judge
DEV.to AI·22 de mayo de 2026
El autor usa GEMBA-MQM v2, un sistema basado en LLM, para la evaluación automática de la calidad de traducciones, categorizando errores por tipo y gravedad. A pesar de su alta correlación con anotaciones humanas, el sistema presenta ruido, requiriendo múltiples pasadas para mitigar la variabilidad de las puntuaciones.
Leer original ↗