RESEARCH27
Neural networks for Text-to-Speech evaluation
arXiv CS.CL·13. April 2026
Diese Forschung stellt neuartige neuronale Modelle zur Automatisierung der Qualitätsbewertung von Text-to-Speech (TTS)-Systemen vor, die die Einschränkungen traditioneller menschlicher subjektiver Beurteilungen überwinden. Sie schlägt NeuralSBS für relative Bewertungen und Verbesserungen an MOSNet und WhisperBert für absolute Bewertungen vor, mit dem Ziel, Expertenurteile effizient zu approximieren.
Original lesen ↗