RESEARCH27
Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels
arXiv CS.LG·18 de mayo de 2026
Este estudio investiga el impacto de la cuantificación post-entrenamiento en la calidad de los Grandes Modelos de Lenguaje (LLMs), revelando que la compresión puede llevar a la aparición de sesgos. La cuantificación de 3 bits hizo que entre el 6% y el 21% de los elementos previamente imparciales desarrollaran nuevos comportamientos estereotipados en modelos como Qwen2.5-7B, Mistral-7B y Phi-3.5-mini.
Leer original ↗