RESEARCH↑ trending42
Transformers with Selective Access to Early Representations [R]
Reddit r/MachineLearning·6 de maio de 2026
![Transformers with Selective Access to Early Representations [R]](/cdn-cgi/image/width=3840,quality=75,format=webp/https://preview.redd.it/bfj0qllk9fzg1.png?width=140&height=47&auto=webp&s=afd139021e7256d039453286e5a71d859d7fe9bb)
O artigo introduz SATFormer, uma nova variante de Transformer que melhora a eficiência ao permitir que os "heads" reacessem seletivamente representações iniciais, em vez de copiá-las uniformemente. Esse mecanismo de "gating" dependente do contexto otimiza a reutilização de informações, oferecendo um melhor equilíbrio entre eficiência e desempenho.
Ler original ↗