RESEARCH27
Revealing Interpretable Failure Modes of VLMs
arXiv CS.AI·14. Mai 2026
Vision-Sprach-Modelle (VLMs) können trotz ihrer breiten Schlussfolgerungsfähigkeiten in realen Situationen katastrophale Fehler aufweisen. REVELIO ist ein Framework zur systematischen Aufdeckung interpretierbarer Fehlermodi in VLMs, das eine diversitätssensible Beam-Suche und ein Gaußsches-Prozess-Thompson-Sampling kombiniert, um die Fehlerlandschaft abzubilden.
Original lesen ↗