RESEARCH27

Raon-Speech Technical Report

arXiv CS.CL·26 de mayo de 2026

Raon-Speech es un modelo de lenguaje de voz de 9 mil millones de parámetros de alto rendimiento para la comprensión, respuesta y generación de voz en inglés y coreano, logrando excelentes resultados en 42 benchmarks. Transforma con éxito un LLM pre-entrenado en un SpeechLM, manteniendo sólidas capacidades de texto a través de etapas de entrenamiento específicas.

multimodal AI Benchmarking Natural Language Processing large language models Speech Recognition

Leer original ↗