← heapsort-ai

LLM benchmarking

2 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/17/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

Der Autor führte einen persönlichen Benchmark durch, bei dem Qwen 3.6 35B Gemma 4 26B in Tests zur Bewertung von Agentenfähigkeiten, Programmierung, Bild-zu-Text-Synthese, Befolgung von Anweisungen und logischem Denken deutlich übertraf. Qwen behob mehr Probleme, zeigte weniger Regressionen und erledigte die Aufgaben in kürzerer Zeit, was auf eine überlegene Gesamtleistung hindeutet.

42