ARTICLE↑ trending42
Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]
Reddit r/MachineLearning·23 de abril de 2026
Este contenido aborda el problema de que la Tasa de Error de Palabras (WER) penaliza las diferencias de formato en las evaluaciones STT, lo que lleva a puntuaciones imprecisas. Para resolverlo, se lanzó la biblioteca de código abierto `gladia-normalization`, que normaliza las transcripciones antes del cálculo del WER, asegurando una evaluación más justa de la calidad del reconocimiento.
Leer original ↗