MiniMax-M2.7 NVFP4 on 2x RTX PRO 6000 Blackwell — bench numbers
Ce contenu présente les résultats de benchmark pour le LLM MiniMax-M2.7, utilisant la quantification NVFP4 sur une configuration à deux GPU NVIDIA RTX PRO 6000 Blackwell. Il détaille le débit de décodage à différents niveaux de concurrence et les performances de préremplissage pour diverses tailles de contexte.


