ARTICLE↑ trending38
Gemma 4 - MLX doesn't seem better than GGUF
Reddit r/LocalLLaMA·19 de abril de 2026
Un usuario compara el rendimiento del modelo Gemma 4-26b-a4b en versiones MLX y GGUF en un M1 Max con 32GB de RAM. Las pruebas con un prompt de 3k tokens indican que GGUF es ligeramente más rápido tanto en el procesamiento del prompt como en los tokens por segundo.
Leer original ↗