ARTICLE↑ trending38
Gemma 4 - MLX doesn't seem better than GGUF
Reddit r/LocalLLaMA·19 avril 2026
Un utilisateur compare les performances du modèle Gemma 4-26b-a4b en versions MLX et GGUF sur un M1 Max avec 32GB de RAM. Les tests avec un prompt de 3k tokens indiquent que GGUF est légèrement plus rapide à la fois pour le traitement du prompt et les tokens par seconde.
Lire l'original ↗