← heapsort-ai

failure modes

5 items

RESEARCHarXiv CS.AI·26d atrás

Revealing Interpretable Failure Modes of VLMs

Modelos de Visão-Linguagem (VLMs) podem apresentar falhas catastróficas em cenários reais, apesar de suas amplas capacidades de raciocínio. REVELIO é um framework que identifica modos de falha interpretáveis em VLMs, combinando busca em feixe consciente da diversidade e amostragem de Thompson com processo gaussiano para mapear o cenário de falhas.

27
ARTICLEDEV.to AI·24/04/2026

I Ran 20 Cycles in a Row and Every Single One Failed — Here's What That Taught Me About Agent Design

O autor descreve a experiência de um agente de IA falhando repetidamente devido a um erro interno, mas continuando a registrar a mesma lição sem conseguir agir sobre ela. Ele critica que um loop de repetição sem um disjuntor não é resiliência, mas sim ruído, destacando uma falha comum em arquiteturas de agentes onde insights não influenciam o comportamento.

27