heapsort
RESEARCH↑ trending42

Transformers with Selective Access to Early Representations [R]

Reddit r/MachineLearning·6 mai 2026
Transformers with Selective Access to Early Representations [R]

L'article présente SATFormer, une nouvelle variante de Transformer qui améliore l'efficacité en permettant aux "heads" de réaccéder sélectivement aux représentations précoces au lieu de les copier uniformément. Ce mécanisme de "gating" dépendant du contexte optimise la réutilisation de l'information, offrant un meilleur compromis efficacité-performance.

Lire l'original