heapsort
RESEARCH↑ trending42

Elastic Attention Cores for Scalable Vision Transformers [R]

Reddit r/MachineLearning·13 de mayo de 2026
Elastic Attention Cores for Scalable Vision Transformers [R]

Este artículo presenta los Núcleos de Atención Elásticos como un nuevo bloque de construcción para Vision Transformers escalables, abordando el alto costo de la autoatención densa. El enfoque utiliza una estructura de atención escasa por bloques de núcleo-periferia y dropout anidado para ajustes elásticos del costo de inferencia, logrando una precisión competitiva.

Leer original