NEWS↑ trending48
INT3 compression+fused metal kernels [R]
Reddit r/MachineLearning·22 de abril de 2026
Um pesquisador e fundador solo desenvolveu compressão de modelos INT3 e um cache KV de 2 bits com kernels Metal customizados para Mac (M-series). Qwen 7B está disponível em prévia, e otimizações adicionais e suporte a GPU estão planejados.
Ler original ↗