NEWS↑ trending41

ubergarm/Kimi-K2.6-GGUF Q4_X now available

Reddit r/LocalLLaMA·20 de abril de 2026

O usuário ubergarm/VoidAlchemy anunciou a disponibilidade da versão quantizada "Q4_X" do modelo Kimi-K2.6-GGUF, agradecendo aos colaboradores jukofyork e AesSedai pelas dicas na otimização. O modelo, que requer aproximadamente 584GB de RAM+VRAM, é compatível com ik_llama.cpp e mainline llama.cpp, e o autor planeja lançar quantizações menores e informações sobre imatrix em breve.

LLMs model quantization open-source AI

Ler original ↗