ARTICLE↑ trending42

Built a normalizer so WER stops penalizing formatting differences in STT evals! [P]

Reddit r/MachineLearning·23. April 2026

Dieser Inhalt befasst sich mit dem Problem, dass die Wortfehlerrate (WER) Formatierungsunterschiede bei STT-Bewertungen bestraft, was zu ungenauen Ergebnissen führt. Um dies zu beheben, wurde die Open-Source-Bibliothek `gladia-normalization` veröffentlicht, die Transkripte vor der WER-Berechnung normalisiert und so eine fairere Bewertung der Erkennungsqualität gewährleistet.

Open Source evaluation NLP Speech-to-Text

Original lesen ↗