NEWS↑ trending40
DFlash Doubles the T/S Gen Speed of Qwen3.5 27B (BF16) on Mac M5 Max
Reddit r/LocalLLaMA·15. April 2026

Die neue DFlash-Unterstützung in oMLX 0.3.5 RC1 hat Berichten zufolge die Generierungsgeschwindigkeit des Qwen3.5 27B (BF16) Modells auf einem Mac M5 Max von 9 auf 22 T/S verdoppelt. Dieser Durchbruch könnte die lokale Bereitstellung dieses hochwertigen Modells bei höheren Quantisierungen/vollen Gewichten erheblich verbessern.
Original lesen ↗