← heapsort-ai

failure modes

5 items

RESEARCHarXiv CS.AI·hace 26d

Revealing Interpretable Failure Modes of VLMs

A pesar de sus amplias capacidades de razonamiento, los Modelos de Visión-Lenguaje (VLMs) pueden experimentar fallos catastróficos en situaciones reales. Se presenta REVELIO, un marco para descubrir sistemáticamente modos de fallo interpretables en VLMs, combinando una búsqueda en haz consciente de la diversidad y muestreo de Thompson con proceso gaussiano para mapear el paisaje de fallos.

27
ARTICLEDEV.to AI·24/4/2026

I Ran 20 Cycles in a Row and Every Single One Failed — Here's What That Taught Me About Agent Design

El autor relata una experiencia en la que un agente de IA falló repetidamente debido a un error interno, pero siguió registrando la misma lección sin poder actuar en consecuencia. Critica que un bucle de reintento sin un disyuntor no es resiliencia, sino ruido, señalando un modo de fallo común en arquitecturas de agentes donde las ideas no influyen en el comportamiento.

27