ARTICLE↑ trending41
Takeaways & discussion about the DeepSeek V4 architecture
Reddit r/LocalLLaMA·24 de abril de 2026
Este artículo analiza las novedades arquitectónicas de DeepSeek V4, destacando su sistema de atención híbrida (CSA + HCA) y las Manifold-Constrained Hyper-Connections. También aborda el entrenamiento FP4 QAT a escala de frontera, diferenciándolo de modelos anteriores.
Leer original ↗