ARTICLE↑ trending42

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Reddit r/MachineLearning·23 avril 2026

Ce contenu traite du problème de la pénalisation des différences de formatage par le Taux d'Erreur de Mots (WER) dans les évaluations STT, entraînant des scores imprécis. Pour résoudre ce problème, la bibliothèque open-source `gladia-normalization` a été lancée, qui normalise les transcriptions avant le calcul du WER, garantissant une évaluation plus juste de la qualité de la reconnaissance.

Open Source evaluation NLP Speech-to-Text

Lire l'original ↗