Elastic Attention Cores for Scalable Vision Transformers [R]
Este artigo propõe Elastic Attention Cores como um novo bloco construtivo para Vision Transformers escaláveis, abordando o alto custo da autoatenção densa. A abordagem utiliza uma estrutura de atenção esparsa em bloco e dropout aninhado para permitir ajustes elásticos no custo de inferência, alcançando alta precisão.
![Elastic Attention Cores for Scalable Vision Transformers [R]](/cdn-cgi/image/width=3840,quality=75,format=webp/https://preview.redd.it/zjea47ez7w0h1.png?width=140&height=140&crop=1:1,smart&auto=webp&s=2017a3d330a172670baae5645ddff3137bbe1df6)