RESEARCH27

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

arXiv CS.LG·18 de maio de 2026

Este estudo investiga o impacto da quantização pós-treinamento na qualidade dos Grandes Modelos de Linguagem (LLMs), revelando que a compressão pode levar ao surgimento de vieses. A quantização de 3 bits fez com que 6-21% dos itens anteriormente imparciais desenvolvessem novos comportamentos estereotipados em modelos como Qwen2.5-7B, Mistral-7B e Phi-3.5-mini.

Model Compression LLMs quantization model quality Bias

Ler original ↗