heapsort
NEWS↑ trending40

DFlash Doubles the T/S Gen Speed of Qwen3.5 27B (BF16) on Mac M5 Max

Reddit r/LocalLLaMA·15 de abril de 2026
DFlash Doubles the T/S Gen Speed of Qwen3.5 27B (BF16) on Mac M5 Max

El nuevo soporte DFlash en oMLX 0.3.5 RC1 ha duplicado la velocidad de generación del modelo Qwen3.5 27B (BF16) en un Mac M5 Max, de 9 a 22 T/S. Esta mejora es fundamental para la implementación local de este modelo de alta calidad con pesos completos o cuantizaciones más altas.

Leer original