RESEARCH27
Raon-Speech Technical Report
arXiv CS.CL·26 de maio de 2026
Raon-Speech é um modelo de linguagem de fala de 9 bilhões de parâmetros para compreensão, resposta e geração de fala em inglês e coreano, alcançando desempenho superior em 42 benchmarks. Ele transforma eficazmente um LLM pré-treinado em um SpeechLM, mantendo fortes capacidades de texto através de estágios de treinamento específicos.
Ler original ↗