RESEARCH28
Super Apriel: One Checkpoint, Many Speeds
arXiv CS.LG·23 de abril de 2026
Foi lançada a Super Apriel, uma supernet de 15B parâmetros onde cada camada do decodificador oferece quatro opções de mixer treinadas, permitindo diferentes pré-definições de velocidade/qualidade a partir de um único checkpoint. Isso permite ganhos de throughput de 2.9x a 10.7x com retenção de qualidade entre 96% e 77%, e também decodificação especulativa sem um modelo de rascunho separado.
neural network architecturePerformance optimizationattention mechanismslarge language modelsSpeculative Decoding
Ler original ↗