NEWS↑ trending41

ubergarm/Kimi-K2.6-GGUF Q4_X now available

Reddit r/LocalLLaMA·20 de abril de 2026

El usuario ubergarm/VoidAlchemy anunció la disponibilidad de la versión cuantificada "Q4_X" del modelo Kimi-K2.6-GGUF, agradeciendo a jukofyork y AesSedai por sus consejos. Este modelo requiere aproximadamente 584GB de RAM+VRAM y es compatible con ik_llama.cpp y mainline llama.cpp; se planean cuantificaciones más pequeñas e información sobre imatrix próximamente.

LLMs model quantization open-source AI

Leer original ↗