RESEARCH29

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

arXiv CS.AI·13 de mayo de 2026

Este artículo de investigación muestra que los anclajes numéricos incrustados en las imágenes sesgan sistemáticamente los juicios de calidad de los Modelos de Visión-Lenguaje (VLMs). El sondeo capa por capa revela que las capas óptimas para la predicción de calidad son más profundas que donde satura la clasificación del anclaje, estableciendo una explicación causal del sesgo de anclaje visual.

neural networks Vision-Language Models Model Evaluation representation learning Bias

Leer original ↗