RESEARCH27

Neural networks for Text-to-Speech evaluation

arXiv CS.CL·13. April 2026

Diese Forschung stellt neuartige neuronale Modelle zur Automatisierung der Qualitätsbewertung von Text-to-Speech (TTS)-Systemen vor, die die Einschränkungen traditioneller menschlicher subjektiver Beurteilungen überwinden. Sie schlägt NeuralSBS für relative Bewertungen und Verbesserungen an MOSNet und WhisperBert für absolute Bewertungen vor, mit dem Ziel, Expertenurteile effizient zu approximieren.

neural networks AI models Speech Evaluation machine learning Text-to-Speech

Original lesen ↗