heapsort
RESEARCH27

Theory-optimal Quantization Based on Flatness

arXiv CS.LG·20 de maio de 2026

Esta pesquisa modela a relação entre erro de quantização e outliers em Large Language Models (LLMs) e introduz uma nova métrica, Flatness, para quantificar a distribuição de outliers. Com base nisso, deriva uma solução teórica ótima e propõe a Quantização Diagonal Bidirecional (BDQ) para quantização pós-treinamento.

Ler original