heapsort
ARTICLE↑ trending46

[P] Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book

Reddit r/LocalLLaMA·15 de abril de 2026

Um novo livro e código-fonte aberto foram lançados, detalhando como construir arquiteturas de LLMs modernas como GPT-2, Llama 3 e DeepSeek do zero em PyTorch. Ele explica as mudanças arquitetônicas para transformar GPT-2 em Llama 3 e implementa os recursos avançados do DeepSeek.

Ler original