← heapsort-ai

Translation

38 items

RESEARCH↑ trendingReddit r/MachineLearning·14/4/2026

We benchmarked TranslateGemma against 5 other LLMs on subtitle translation across 6 languages. At first glance the numbers told a clean story, but then human QA added a chapter. [D]

Este contenido presenta un estudio comparativo que evaluó seis Grandes Modelos de Lenguaje (LLMs), incluyendo TranslateGemma-12b, en la traducción de subtítulos del inglés a seis idiomas. Los modelos fueron clasificados utilizando métricas de Evaluación de Calidad (QE) sin referencia y una métrica combinada personalizada llamada TQI, donde TranslateGemma-12b resultó ser el modelo con mejor rendimiento general.

We benchmarked TranslateGemma against 5 other LLMs on subtitle translation across 6 languages. At first glance the numbers told a clean story, but then human QA added a chapter. [D]
70
RESEARCH↑ trendingReddit r/LocalLLaMA·14/4/2026

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch

Un estudio comparó TranslateGemma-12b con cinco LLM de frontera en la traducción de subtítulos para seis pares de idiomas, revelando que el modelo específico para la tarea superó consistentemente a los modelos de propósito general. Aunque los números iniciales mostraron una victoria clara, el control de calidad humano añadió una salvedad importante que se detallará en el informe completo.

We benchmarked TranslateGemma-12b against 5 frontier LLMs on subtitle translation - it won across the board, with one significant catch
42
ARTICLE↑ trendingReddit r/LocalLLaMA·21/4/2026

An actual example of "If you dont run it, you dont own it" and Gemma 4 beats both Chat GPT and Gemini Chat

El autor comparte su experiencia utilizando varios modelos de IA (GPT OOS 120B, Qwen 3 Max, Chat GPT 4o) para traducir una novela china, enfrentando desafíos con la consistencia de los nombres y la censura. Chat GPT 4o fue inicialmente el mejor en precisión y calidad de traducción, aunque otros modelos mostraron degradación o filtrado con el tiempo.

35
ARTICLEDEV.to AI·hace 18d

How I use an LLM as a translation judge

El autor usa GEMBA-MQM v2, un sistema basado en LLM, para la evaluación automática de la calidad de traducciones, categorizando errores por tipo y gravedad. A pesar de su alta correlación con anotaciones humanas, el sistema presenta ruido, requiriendo múltiples pasadas para mitigar la variabilidad de las puntuaciones.

27