MiniMax-M2.7 NVFP4 on 2x RTX PRO 6000 Blackwell — bench numbers
Este contenido presenta los resultados de benchmark para el LLM MiniMax-M2.7, utilizando cuantificación NVFP4 en una configuración de doble GPU NVIDIA RTX PRO 6000 Blackwell. Detalla el rendimiento de decodificación en varios niveles de concurrencia y el rendimiento de prellenado en diferentes tamaños de contexto.


