ARTICLE↑ trending42
MiniMax M2.7 GGUF Investigation, Fixes, Benchmarks
Reddit r/LocalLLaMA·14 de abril de 2026

Una investigación sobre MiniMax-M2.7 GGUF encontró que los NaNs en la perplejidad afectan al 21-38% de los GGUF en Hugging Face. El problema se atribuyó a desbordamientos en llama.cpp, específicamente en `blk.61.ffn_down_exps` para cuantificaciones Q5_K y Q4_K, y el equipo corrigió los suyos.
Leer original ↗