ARTICLE↑ trending42

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Reddit r/MachineLearning·23 de abril de 2026

Este contenido aborda el problema de que la Tasa de Error de Palabras (WER) penaliza las diferencias de formato en las evaluaciones STT, lo que lleva a puntuaciones imprecisas. Para resolverlo, se lanzó la biblioteca de código abierto `gladia-normalization`, que normaliza las transcripciones antes del cálculo del WER, asegurando una evaluación más justa de la calidad del reconocimiento.

Open Source evaluation NLP Speech-to-Text

Leer original ↗