← heapsort-ai

softmax

2 items

ARTICLEDEV.to AI·11/4/2026

Output Layer Explained — Logits, Softmax, Cross-Entropy, and Why They Work Together

Este artículo explica cómo las redes neuronales generan predicciones significativas a través de probabilidades, detallando la función de los logits, softmax y la entropía cruzada. Aborda cómo estos componentes transforman las salidas brutas en distribuciones de probabilidad interpretables y cómo la función de pérdida mide la precisión, garantizando estabilidad numérica.

27
RESEARCHarXiv CS.LG·6/5/2026

On the Invariants of Softmax Attention

Esta investigación define el "campo de energía" en la atención softmax, revelando propiedades invariantes esenciales. Diferencia los invariantes a nivel de mecanismo, derivados de la estructura algebraica, de las regularidades a nivel de modelo observadas en modelos de lenguaje autorregresivos.

27