RESEARCH28
LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection
arXiv CS.LG·4 de junio de 2026
LiftQuant presenta un nuevo marco para el control continuo del ancho de bits en Modelos de Lenguaje Grandes, abordando las limitaciones de la cuantificación basada en enteros. Utiliza un mecanismo de "elevar y proyectar" para un ajuste casi continuo del ancho de bits para una implementación óptima.
Leer original ↗