NEWS↑ trending41
ubergarm/Kimi-K2.6-GGUF Q4_X now available
Reddit r/LocalLLaMA·20 de abril de 2026

El usuario ubergarm/VoidAlchemy anunció la disponibilidad de la versión cuantificada "Q4_X" del modelo Kimi-K2.6-GGUF, agradeciendo a jukofyork y AesSedai por sus consejos. Este modelo requiere aproximadamente 584GB de RAM+VRAM y es compatible con ik_llama.cpp y mainline llama.cpp; se planean cuantificaciones más pequeñas e información sobre imatrix próximamente.
Leer original ↗