RESEARCH↑ trending42

Elastic Attention Cores for Scalable Vision Transformers [R]

Reddit r/MachineLearning·13 de mayo de 2026

Este artículo presenta los Núcleos de Atención Elásticos como un nuevo bloque de construcción para Vision Transformers escalables, abordando el alto costo de la autoatención densa. El enfoque utiliza una estructura de atención escasa por bloques de núcleo-periferia y dropout anidado para ajustes elásticos del costo de inferencia, logrando una precisión competitiva.

deep learning computer vision attention mechanisms Vision Transformers

Leer original ↗