MiniMax M2.7 GGUF Investigation, Fixes, Benchmarks
Uma investigação sobre o MiniMax-M2.7 GGUF revelou que NaNs na perplexidade afetam 21-38% dos GGUFs no Hugging Face. O problema foi atribuído a estouro no llama.cpp, especificamente em `blk.61.ffn_down_exps` para quantizações Q5_K e Q4_K, e a equipe corrigiu os seus.
