MiniMax M2.7 GGUF Investigation, Fixes, Benchmarks
Une enquête sur MiniMax-M2.7 GGUF a révélé que les NaNs de perplexité affectent 21-38% des GGUF sur Hugging Face. Le problème a été attribué au débordement dans llama.cpp, spécifiquement dans `blk.61.ffn_down_exps` pour les quantifications Q5_K et Q4_K, et l'équipe a corrigé les siens.
