heapsort
NEWS↑ trending40

DFlash Doubles the T/S Gen Speed of Qwen3.5 27B (BF16) on Mac M5 Max

Reddit r/LocalLLaMA·15 de abril de 2026
DFlash Doubles the T/S Gen Speed of Qwen3.5 27B (BF16) on Mac M5 Max

O novo suporte DFlash no oMLX 0.3.5 RC1 dobrou a velocidade de geração do modelo Qwen3.5 27B (BF16) em um Mac M5 Max, passando de 9 para 22 T/S. Esta melhoria é crucial para a implantação local deste modelo de alta qualidade com pesos completos ou quantizações mais altas.

Ler original