ubergarm/Kimi-K2.6-GGUF Q4_X now available
L'utilisateur ubergarm/VoidAlchemy a annoncé la disponibilité de la version quantifiée "Q4_X" du modèle Kimi-K2.6-GGUF, remerciant jukofyork et AesSedai pour leur aide. Ce modèle nécessite environ 584 Go de RAM+VRAM et est compatible avec ik_llama.cpp et mainline llama.cpp, avec des quantifications plus petites et des informations sur imatrix prévues bientôt.
