← heapsort-ai

PyTorch

18 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/15/2026

[P] Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book

Ein neues Buch und Open-Source-Code wurden veröffentlicht, die detailliert beschreiben, wie moderne LLM-Architekturen wie GPT-2, Llama 3 und DeepSeek von Grund auf in PyTorch erstellt werden können. Es erläutert die architektonischen Änderungen, die zur Transformation von GPT-2 in Llama 3 erforderlich sind, und implementiert die erweiterten Funktionen von DeepSeek.

46
ARTICLE↑ trendingReddit r/MachineLearning·4/11/2026

FlashAttention (FA1–FA4) in PyTorch - educational implementations focused on algorithmic differences [P]

Ein aktualisiertes PyTorch-Repository bietet lehrreiche Implementierungen der FlashAttention-Versionen FA1 bis FA4. Der Schwerpunkt liegt auf der Demonstration der algorithmischen Unterschiede und der Evolution der Methode, um ein Verständnis ihrer Designideen ohne Eingehen auf hardwarespezifische Details zu ermöglichen.

45
ARTICLE↑ trendingReddit r/MachineLearning·4/15/2026

Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book [p]

Ein leitender Ingenieur verbrachte das letzte Jahr damit, fünf LLM-Architekturen, darunter GPT-2, Llama 3 und DeepSeek, von Grund auf in PyTorch zu implementieren. Das Projekt mündete in Open-Source-Code und einem detaillierten Buch, das den Prozess dokumentiert und fortgeschrittene Konzepte wie KV-Cache, MoE und FP8-Quantisierung erklärt.

44
RESEARCH↑ trendingReddit r/MachineLearning·4/18/2026

We’re proud to open-source LIDARLearn [R] [D] [P]

LIDARLearn ist eine vereinheitlichte PyTorch-Bibliothek für 3D-Punktwolken-Deep-Learning, die 56 sofort einsatzbereite Konfigurationen und integrierte Kreuzvalidierung unterstützt. Sie automatisiert zudem die Erstellung publikationsreifer LaTeX-PDFs nach dem Training und ist somit ideal für Forscher in 3D-Computer Vision und Fernerkundung.

We’re proud to open-source LIDARLearn [R] [D] [P]
44
ARTICLE↑ trendingReddit r/MachineLearning·4/12/2026

Educational PyTorch repo for distributed training from scratch: DP, FSDP, TP, FSDP+TP, and PP [P]

Dieses lehrreiche PyTorch-Repository implementiert verschiedene Techniken des verteilten Trainingsparallelismus, darunter DP, FSDP, TP und PP, von Grund auf neu. Es implementiert explizit die Vorwärts-/Rückwärtslogik und Kollektive, wodurch Benutzer die Algorithmen und Kommunikationsmuster ohne übergeordnete Abstraktionen direkt verstehen können.

43
CASE↑ trendingReddit r/LocalLLaMA·4/15/2026

DGX Spark just arrived — planning to run vLLM + local models, looking for advice

Ein neuer DGX Spark Besitzer sucht Ratschläge zur Konfiguration für lokale LLM-Inferenz und plant die Nutzung von vLLM, PyTorch und Hugging Face Modellen für ein privates API-Backend. Er bittet um Empfehlungen für effiziente Modelle, Optimierungstipps für vLLM auf Unified-Memory-Systemen und Einblicke in den realen Durchsatz.

DGX Spark just arrived — planning to run vLLM + local models, looking for advice
42
ARTICLEDEV.to AI·5/1/2026

I Rebuilt Karpathy's NanoChat in JAX. Here's What XLA Gets Right and What It Gets Dead Wrong.

Dieser Inhalt beschreibt die Portierung von Andrej Karpathys NanoChat von PyTorch auf JAX/Flax NNX, wodurch schnelles Training auf einer einzelnen GPU und TPU-Kompatibilität erreicht wurde. Er erläutert die Vorteile von XLA bei der Eliminierung des Python-Overheads, hebt aber auch dessen Einschränkungen bei fortschrittlichen Funktionen und beim Debugging hervor.

27
NEWSDEV.to AI·4/22/2026

Meta — Deep Dive

Dieser Inhalt befasst sich mit Metas KI-Initiativen, darunter LLaMA, PyTorch, FAIR und das neue Modell Muse Spark, das den Aktienkurs des Unternehmens ankurbelte. Er behandelt auch die NFL-Draft-Prognosen von Meta AI und die vertiefte Zusammenarbeit mit Broadcom bei Chips.

27