NEWS↑ trending41
ubergarm/Kimi-K2.6-GGUF Q4_X now available
Reddit r/LocalLLaMA·20 de abril de 2026

O usuário ubergarm/VoidAlchemy anunciou a disponibilidade da versão quantizada "Q4_X" do modelo Kimi-K2.6-GGUF, agradecendo aos colaboradores jukofyork e AesSedai pelas dicas na otimização. O modelo, que requer aproximadamente 584GB de RAM+VRAM, é compatível com ik_llama.cpp e mainline llama.cpp, e o autor planeja lançar quantizações menores e informações sobre imatrix em breve.
Ler original ↗