RESEARCH27
Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models
arXiv CS.CL·28 mai 2026
Cet article propose de nouvelles techniques pour le contrôle précis du style de parole dans les modèles de synthèse vocale (TTS) basés sur des invites. Il aborde l'interpolation de style inter-énoncés et les transitions de style intra-énoncé, dépassant les limitations du contrôle global.
Lire l'original ↗