heapsort
ARTICLE↑ trending41

Takeaways & discussion about the DeepSeek V4 architecture

Reddit r/LocalLLaMA·24. April 2026

Dieser Artikel behandelt die architektonischen Neuerungen von DeepSeek V4, wobei sein hybrides Aufmerksamkeits-System (CSA + HCA) und die Manifold-Constrained Hyper-Connections hervorgehoben werden. Er bespricht auch das FP4 QAT-Training im Grenzbereich und unterscheidet es von früheren Modellen.

Original lesen