NEWS↑ trending48
INT3 compression+fused metal kernels [R]
Reddit r/MachineLearning·22 de abril de 2026
Un investigador y fundador solitario desarrolló compresión de modelos INT3 y una caché KV de 2 bits con kernels Metal personalizados para Mac (M-series). Qwen 7B está disponible en vista previa, y se planean optimizaciones adicionales y soporte para GPU.
Leer original ↗