heapsort
ARTICLE↑ trending46

[P] Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book

Reddit r/LocalLLaMA·15 de abril de 2026

Se lanza un nuevo libro y código fuente abierto, que detalla cómo construir arquitecturas LLM modernas como GPT-2, Llama 3 y DeepSeek desde cero en PyTorch. Explica los cambios arquitectónicos para transformar GPT-2 en Llama 3 e implementa las características avanzadas de DeepSeek.

Leer original