RESEARCHarXiv CS.CL·13d atrás
Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models
Esta pesquisa aborda a Lacuna de Estabilidade-Expressividade em Modelos de Linguagem Falada (SLMs) para idiomas com poucos recursos, causada pelo uso extensivo de dados sintéticos. Enquanto dados sintéticos melhoram a precisão fonética, eles degradam a expressividade prosódica, um fenômeno chamado Erosão Sintética. O artigo introduz estruturas de autoalinhamento para recuperar a expressividade.
27