MiniMax-M2.7 NVFP4 on 2x RTX PRO 6000 Blackwell — bench numbers
Dieser Inhalt präsentiert Benchmark-Ergebnisse für das MiniMax-M2.7 LLM, das NVFP4-Quantisierung auf einem Dual-NVIDIA RTX PRO 6000 Blackwell GPU-Setup verwendet. Er detailliert den Dekodierdurchsatz bei verschiedenen Parallelitätsstufen und die Vorfüllleistung über unterschiedliche Kontextgrößen hinweg.


