DOC27
Building makemore Part 3: Activations & Gradients, BatchNorm
Andrej Karpathy (YouTube)·4. Oktober 2022

Dieser Inhalt, 'Building makemore Teil 3', befasst sich mit fortgeschrittenen neuronalen Netzwerkkonzepten, die für das Modelltraining entscheidend sind. Er behandelt speziell Aktivierungen, Gradiente und die Anwendung von BatchNorm zur Verbesserung von Stabilität und Leistung.
Original lesen ↗