RESEARCHarXiv CS.LG·27/04/2026
Focus Session: Hardware and Software Techniques for Accelerating Multimodal Foundation Models
Cette recherche propose une méthodologie multicouche pour accélérer les modèles de fondation multimodaux (MFM) grâce à la co-conception matérielle et logicielle. Elle utilise des techniques d'optimisation telles que la quantification à précision mixte, l'élagage structurel et le décodage spéculatif pour réduire les besoins en calcul et en mémoire.
27