RESEARCHarXiv CS.LG·27/04/2026
Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models
Esta pesquisa apresenta uma metodologia multicamadas para acelerar modelos de fundação multimodais (MFMs) através de co-design de hardware e software. Ela emprega técnicas de otimização como quantização de precisão mista, poda estrutural e decodificação especulativa para reduzir os requisitos computacionais e de memória.
27