RESEARCH27
Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models
arXiv CS.CL·28 de mayo de 2026
Esta investigación aborda la Brecha de Estabilidad-Expresividad en los Modelos de Lenguaje Hablado (SLM) para idiomas de bajos recursos, causada por el uso extensivo de datos sintéticos. Aunque los datos sintéticos mejoran la precisión fonética, degradan la expresividad prosódica, un fenómeno denominado Erosión Sintética. El artículo presenta marcos de autoalineación para recuperar la expresividad.
Leer original ↗