ARTICLE↑ trending46
[P] Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book
Reddit r/LocalLLaMA·15 avril 2026
Un nouveau livre et du code open source sont publiés, détaillant comment construire des architectures LLM modernes comme GPT-2, Llama 3 et DeepSeek à partir de zéro avec PyTorch. Il explique les modifications architecturales pour transformer GPT-2 en Llama 3 et implémente les fonctionnalités avancées de DeepSeek.
Lire l'original ↗