RESEARCH27
Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models
arXiv CS.CL·28 de mayo de 2026
Este artículo propone nuevas técnicas para un control detallado del estilo de habla en modelos de texto a voz (TTS) basados en prompts. Aborda la interpolación de estilo entre enunciados y las transiciones de estilo dentro de un mismo enunciado, superando las limitaciones del control global.
Leer original ↗