heapsort
RESEARCH↑ trending42

Gemma 4 has a systemic attention failure. Here's the proof.

Reddit r/LocalLLaMA·13 de abril de 2026

El autor desarrolló un método de diagnóstico para LLMs que revela un fallo sistémico en la atención de Gemma 4 26B A4B. Se identificaron 29 tensores con una deriva de distribución significativa, 21 de ellos en capas de atención, lo que sugiere un mecanismo de atención comprometido.

Leer original