heapsort
ARTICLE↑ trending38

Gemma 4 - MLX doesn't seem better than GGUF

Reddit r/LocalLLaMA·19. April 2026

Ein Benutzer vergleicht die Leistung des Gemma 4-26b-a4b Modells in MLX- und GGUF-Versionen auf einem M1 Max mit 32GB RAM. Tests mit einem 3k Token Prompt zeigen, dass GGUF sowohl bei der Prompt-Verarbeitung als auch bei den Tokens pro Sekunde etwas schneller ist.

Original lesen