ubergarm/Kimi-K2.6-GGUF Q4_X now available
Der Benutzer ubergarm/VoidAlchemy gab die Verfügbarkeit der quantisierten "Q4_X"-Version des Kimi-K2.6-GGUF-Modells bekannt und dankte jukofyork und AesSedai für ihre Unterstützung bei der Optimierung. Das Modell benötigt etwa 584 GB RAM+VRAM und läuft sowohl auf ik_llama.cpp als auch auf mainline llama.cpp; kleinere Quantisierungen und Imatrix-Informationen sollen bald folgen.
