← heapsort-ai

softmax

2 items

ARTICLEDEV.to AI·11/04/2026

Output Layer Explained — Logits, Softmax, Cross-Entropy, and Why They Work Together

Este artigo explica como redes neurais geram previsões significativas através de probabilidades, detalhando a função dos logits, softmax e entropia cruzada. Ele aborda como esses componentes transformam saídas brutas em distribuições de probabilidade interpretáveis e como a função de perda mede a precisão, garantindo estabilidade numérica.

27
RESEARCHarXiv CS.LG·06/05/2026

On the Invariants of Softmax Attention

Este estudo define o "campo de energia" na atenção softmax, revelando propriedades invariantes essenciais. Ele diferencia invariantes de nível de mecanismo, baseados na estrutura algébrica, de regularidades de nível de modelo observadas em modelos de linguagem autorregressivos.

27