heapsort
RESEARCH27

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

arXiv CS.CL·28 de maio de 2026

Este artigo propõe novas técnicas para controle de estilo de fala em modelos de texto-para-voz (TTS) baseados em prompts. Aborda a interpolação de estilo entre enunciados e transições de estilo dentro de um único enunciado, superando as limitações de controle global.

Ler original