RESEARCH27
Neural networks for Text-to-Speech evaluation
arXiv CS.CL·13 de abril de 2026
Esta investigación propone modelos neuronales innovadores para automatizar la evaluación de la calidad de los sistemas Text-to-Speech (TTS), superando las limitaciones de las evaluaciones humanas. Presenta NeuralSBS para evaluaciones relativas y mejoras a MOSNet y WhisperBert para evaluaciones absolutas, buscando aproximar los juicios de expertos.
Leer original ↗