ARTICLE↑ trending42
Speculative Decoding works great for Gemma 4 31B with E2B draft (+29% avg, +50% on code)
Reddit r/LocalLLaMA·12. April 2026
Tests zum spekulativen Decoding, bei denen Gemma 4 E2B als Entwurf für Gemma 4 31B verwendet wurde, zeigten eine bemerkenswerte Leistungsverbesserung. Die durchschnittliche Geschwindigkeit stieg um 29 %, erreichte in der Codegenerierung sogar 50 %, und das mit spezifischen Hard- und Softwarekonfigurationen.
Original lesen ↗