RESEARCH27

Neural networks for Text-to-Speech evaluation

arXiv CS.CL·13 de abril de 2026

Esta investigación propone modelos neuronales innovadores para automatizar la evaluación de la calidad de los sistemas Text-to-Speech (TTS), superando las limitaciones de las evaluaciones humanas. Presenta NeuralSBS para evaluaciones relativas y mejoras a MOSNet y WhisperBert para evaluaciones absolutas, buscando aproximar los juicios de expertos.

neural networks AI models Speech Evaluation machine learning Text-to-Speech

Leer original ↗