RESEARCH27

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

arXiv CS.CL·28 mai 2026

Cet article propose de nouvelles techniques pour le contrôle précis du style de parole dans les modèles de synthèse vocale (TTS) basés sur des invites. Il aborde l'interpolation de style inter-énoncés et les transitions de style intra-énoncé, dépassant les limitations du contrôle global.

AI models prompt-engineering speech synthesis machine learning Text-to-Speech

Lire l'original ↗