ARTICLE↑ trending38

Gemma 4 - MLX doesn't seem better than GGUF

Reddit r/LocalLLaMA·19 avril 2026

Un utilisateur compare les performances du modèle Gemma 4-26b-a4b en versions MLX et GGUF sur un M1 Max avec 32GB de RAM. Les tests avec un prompt de 3k tokens indiquent que GGUF est légèrement plus rapide à la fois pour le traitement du prompt et les tokens par seconde.

model performance apple-silicon Gemma MLX GGUF

Lire l'original ↗