RESEARCH27
Neural networks for Text-to-Speech evaluation
arXiv CS.CL·13 avril 2026
Cette recherche introduit de nouveaux modèles neuronaux pour automatiser l'évaluation de la qualité des systèmes Text-to-Speech (TTS), contournant les limites des évaluations humaines subjectives. Elle propose NeuralSBS pour les évaluations relatives et des améliorations à MOSNet et WhisperBert pour les évaluations absolues, visant à approcher les jugements d'experts.
Lire l'original ↗