RESEARCH29

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

arXiv CS.AI·13. Mai 2026

Diese Forschungsarbeit zeigt, dass eingebettete numerische Anker auf Bildern systematisch die Qualitätsurteile von Vision-Language-Modellen (VLMs) verzerren. Schichtweise Sondierungen offenbaren, dass optimale Schichten für die Qualitätsprognose tiefer liegen als jene, in denen die Ankerklassifizierung sättigt, was eine kausale Erklärung für die visuelle Verankerungsverzerrung liefert.

neural networks Vision-Language Models Model Evaluation representation learning Bias

Original lesen ↗