RESEARCH27

Revealing Interpretable Failure Modes of VLMs

arXiv CS.AI·14 de maio de 2026

Modelos de Visão-Linguagem (VLMs) podem apresentar falhas catastróficas em cenários reais, apesar de suas amplas capacidades de raciocínio. REVELIO é um framework que identifica modos de falha interpretáveis em VLMs, combinando busca em feixe consciente da diversidade e amostragem de Thompson com processo gaussiano para mapear o cenário de falhas.

failure modes AI models VLMs Reliability interpretable AI

Ler original ↗