RESEARCHarXiv CS.CL·13/04/2026
Neural networks for Text-to-Speech evaluation
Cette recherche introduit de nouveaux modèles neuronaux pour automatiser l'évaluation de la qualité des systèmes Text-to-Speech (TTS), contournant les limites des évaluations humaines subjectives. Elle propose NeuralSBS pour les évaluations relatives et des améliorations à MOSNet et WhisperBert pour les évaluations absolues, visant à approcher les jugements d'experts.
27