RESEARCH28
Super Apriel: One Checkpoint, Many Speeds
arXiv CS.LG·23 de abril de 2026
Se ha lanzado Super Apriel, una superred de 15 mil millones de parámetros donde cada capa del decodificador ofrece cuatro opciones de mezclador entrenadas, permitiendo múltiples configuraciones de velocidad/calidad desde un único punto de control. Esto posibilita ganancias de rendimiento de decodificación de 2.9x a 10.7x con una retención de calidad del 96% al 77%, y también la decodificación especulativa sin un modelo de borrador separado.
neural network architecturePerformance optimizationattention mechanismslarge language modelsSpeculative Decoding
Leer original ↗