heapsort
RESEARCH27

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

arXiv CS.CL·28 de maio de 2026

Esta pesquisa aborda a Lacuna de Estabilidade-Expressividade em Modelos de Linguagem Falada (SLMs) para idiomas com poucos recursos, causada pelo uso extensivo de dados sintéticos. Enquanto dados sintéticos melhoram a precisão fonética, eles degradam a expressividade prosódica, um fenômeno chamado Erosão Sintética. O artigo introduz estruturas de autoalinhamento para recuperar a expressividade.

Ler original