heapsort
NEWS↑ trending48

INT3 compression+fused metal kernels [R]

Reddit r/MachineLearning·22 de abril de 2026

Um pesquisador e fundador solo desenvolveu compressão de modelos INT3 e um cache KV de 2 bits com kernels Metal customizados para Mac (M-series). Qwen 7B está disponível em prévia, e otimizações adicionais e suporte a GPU estão planejados.

Ler original