← heapsort-ai

LLM benchmarking

2 items

ARTICLE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen 3.6 35B crushes Gemma 4 26B on my tests

El autor realizó una evaluación personal donde Qwen 3.6 35B superó a Gemma 4 26B en pruebas que evalúan capacidades agenticas, codificación, síntesis de imagen a texto, seguimiento de instrucciones y razonamiento. Qwen corrigió más problemas, tuvo menos regresiones y completó las pruebas en menos tiempo, mostrando un mejor rendimiento general.

42