← heapsort-ai

softmax

2 items

ARTICLEDEV.to AI·4/11/2026

Output Layer Explained — Logits, Softmax, Cross-Entropy, and Why They Work Together

Dieser Artikel erläutert, wie neuronale Netze mithilfe von Wahrscheinlichkeiten aussagekräftige Vorhersagen treffen, wobei die Rolle von Logits, Softmax und Kreuzentropie detailliert beschrieben wird. Er diskutiert, wie diese Komponenten Rohausgaben in interpretierbare Wahrscheinlichkeitsverteilungen umwandeln und wie die Verlustfunktion die Genauigkeit misst, um numerische Stabilität zu gewährleisten.

27
RESEARCHarXiv CS.LG·5/6/2026

On the Invariants of Softmax Attention

Diese Forschung definiert das "Energiefeld" in der Softmax-Aufmerksamkeit und deckt wesentliche invariante Eigenschaften auf. Sie unterscheidet zwischen mechanismusbezogenen Invarianten, die aus der algebraischen Struktur abgeleitet sind, und modellbezogenen Regularitäten, die in autoregressiven Sprachmodellen beobachtet werden.

27