heapsort
ARTICLE↑ trending42

MiniMax M2.7 GGUF Investigation, Fixes, Benchmarks

Reddit r/LocalLLaMA·14. April 2026
MiniMax M2.7 GGUF Investigation, Fixes, Benchmarks

Eine Untersuchung von MiniMax-M2.7 GGUF ergab, dass Perplexity-NaNs 21-38% der GGUFs auf Hugging Face betreffen. Das Problem wurde auf einen Überlauf in llama.cpp zurückgeführt, speziell in `blk.61.ffn_down_exps` für Q5_K- und Q4_K-Quantisierungen, und das Team hat ihren Fehler behoben.

Original lesen