← heapsort-ai

LLM benchmarking

2 items

ARTICLE↑ trendingReddit r/LocalLLaMA·17/04/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

L'auteur a réalisé un benchmark personnel où Qwen 3.6 35B a surpassé Gemma 4 26B lors de tests évaluant les capacités agentiques, de codage, de synthèse image-texte, de suivi d'instructions et de raisonnement. Qwen a corrigé plus de problèmes, a eu moins de régressions et a terminé les tests plus rapidement, démontrant une meilleure performance globale.

42