heapsort
RESEARCH↑ trending42

Gemma 4 has a systemic attention failure. Here's the proof.

Reddit r/LocalLLaMA·13 de abril de 2026

O autor desenvolveu um método de diagnóstico para LLMs que revela uma falha sistêmica na atenção do Gemma 4 26B A4B. Foram identificados 29 tensores com desvio de distribuição significativo, sendo 21 em camadas de atenção, indicando um mecanismo comprometido.

Ler original