← heapsort-ai

spoken language models

1 items

RESEARCHarXiv CS.CL·13d atrás

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Esta pesquisa aborda a Lacuna de Estabilidade-Expressividade em Modelos de Linguagem Falada (SLMs) para idiomas com poucos recursos, causada pelo uso extensivo de dados sintéticos. Enquanto dados sintéticos melhoram a precisão fonética, eles degradam a expressividade prosódica, um fenômeno chamado Erosão Sintética. O artigo introduz estruturas de autoalinhamento para recuperar a expressividade.

27