RESEARCH27

Revealing Interpretable Failure Modes of VLMs

arXiv CS.AI·14. Mai 2026

Vision-Sprach-Modelle (VLMs) können trotz ihrer breiten Schlussfolgerungsfähigkeiten in realen Situationen katastrophale Fehler aufweisen. REVELIO ist ein Framework zur systematischen Aufdeckung interpretierbarer Fehlermodi in VLMs, das eine diversitätssensible Beam-Suche und ein Gaußsches-Prozess-Thompson-Sampling kombiniert, um die Fehlerlandschaft abzubilden.

failure modes AI models VLMs Reliability interpretable AI

Original lesen ↗