RESEARCH28
Super Apriel: One Checkpoint, Many Speeds
arXiv CS.LG·23. April 2026
Super Apriel, ein 15 Milliarden Parameter großer Supernet, wurde veröffentlicht, der vier trainierte Mixer-Optionen pro Decoder-Schicht bietet, um mehrere Geschwindigkeits-/Qualitätseinstellungen aus einem einzigen Checkpoint zu ermöglichen. Dies führt zu einem 2.9x bis 10.7x höheren Decodierungsdurchsatz bei einer Qualitätserhaltung von 96% bis 77% und ermöglicht auch die spekulative Decodierung ohne ein separates Entwurfsmodell.
neural network architecturePerformance optimizationattention mechanismslarge language modelsSpeculative Decoding
Original lesen ↗