heapsort
RESEARCH27

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

arXiv CS.CL·28 de mayo de 2026

Este artículo propone nuevas técnicas para un control detallado del estilo de habla en modelos de texto a voz (TTS) basados en prompts. Aborda la interpolación de estilo entre enunciados y las transiciones de estilo dentro de un mismo enunciado, superando las limitaciones del control global.

Leer original