Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models
Esta investigación presenta una metodología multicapa para acelerar modelos de fundación multimodales (MFMs) mediante el co-diseño de hardware y software. Emplea técnicas de optimización como la cuantificación de precisión mixta, la poda estructural y la decodificación especulativa para reducir los requisitos computacionales y de memoria.