heapsort
NEWS↑ trending48

INT3 compression+fused metal kernels [R]

Reddit r/MachineLearning·22. April 2026

Ein alleiniger Gründer und Forscher hat INT3-Modellkomprimierung und einen 2-Bit-KV-Cache mit kundenspezifischen, fusionierten Metal-Kernels für Mac (M-Serie) entwickelt. Qwen 7B ist als Vorschau verfügbar, und weitere Optimierungen sowie GPU-Unterstützung sind geplant.

Original lesen