heapsort
RESEARCH28

LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection

arXiv CS.LG·4 juin 2026

LiftQuant est un nouveau cadre pour le contrôle continu de la largeur de bit dans les Modèles de Langage de Grande Taille, résolvant les limitations de la quantification basée sur des entiers. Il utilise un mécanisme de "levée puis projection" pour un réglage quasi continu de la largeur de bit pour un déploiement optimal.

Lire l'original