RESEARCH↑ trending42
Gemma 4 has a systemic attention failure. Here's the proof.
Reddit r/LocalLLaMA·13. April 2026
Der Autor entwickelte eine Diagnosemethode für LLMs, die ein systemisches Aufmerksamkeitsversagen in Gemma 4 26B A4B aufdeckte. Diese identifizierte 29 Tensoren mit signifikanter Distributionsdrift, wovon 21 in Aufmerksamkeits-Layern liegen, was auf einen beeinträchtigten Aufmerksamkeitsmechanismus hindeutet.
Original lesen ↗