RESEARCH27

Neural networks for Text-to-Speech evaluation

arXiv CS.CL·13 avril 2026

Cette recherche introduit de nouveaux modèles neuronaux pour automatiser l'évaluation de la qualité des systèmes Text-to-Speech (TTS), contournant les limites des évaluations humaines subjectives. Elle propose NeuralSBS pour les évaluations relatives et des améliorations à MOSNet et WhisperBert pour les évaluations absolues, visant à approcher les jugements d'experts.

neural networks AI models Speech Evaluation machine learning Text-to-Speech

Lire l'original ↗