heapsort
ARTICLE↑ trending46

[P] Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book

Reddit r/LocalLLaMA·15 avril 2026

Un nouveau livre et du code open source sont publiés, détaillant comment construire des architectures LLM modernes comme GPT-2, Llama 3 et DeepSeek à partir de zéro avec PyTorch. Il explique les modifications architecturales pour transformer GPT-2 en Llama 3 et implémente les fonctionnalités avancées de DeepSeek.

Lire l'original