ARTICLE↑ trending38

Gemma 4 - MLX doesn't seem better than GGUF

Reddit r/LocalLLaMA·19 de abril de 2026

Un usuario compara el rendimiento del modelo Gemma 4-26b-a4b en versiones MLX y GGUF en un M1 Max con 32GB de RAM. Las pruebas con un prompt de 3k tokens indican que GGUF es ligeramente más rápido tanto en el procesamiento del prompt como en los tokens por segundo.

model performance apple-silicon Gemma MLX GGUF

Leer original ↗