RESEARCH28
LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection
arXiv CS.LG·4 juin 2026
LiftQuant est un nouveau cadre pour le contrôle continu de la largeur de bit dans les Modèles de Langage de Grande Taille, résolvant les limitations de la quantification basée sur des entiers. Il utilise un mécanisme de "levée puis projection" pour un réglage quasi continu de la largeur de bit pour un déploiement optimal.
Lire l'original ↗