heapsort
ARTICLE↑ trending41

Takeaways & discussion about the DeepSeek V4 architecture

Reddit r/LocalLLaMA·24 avril 2026

Cet article discute des nouveautés architecturales de DeepSeek V4, soulignant son système d'attention hybride (CSA + HCA) et les Manifold-Constrained Hyper-Connections. Il aborde également l'entraînement FP4 QAT à l'échelle de la frontière, le différenciant des modèles précédents.

Lire l'original