← heapsort-ai

failure modes

5 items

RESEARCHarXiv CS.AI·il y a 27j

Revealing Interpretable Failure Modes of VLMs

Malgré leurs larges capacités de raisonnement, les Modèles Vision-Langage (VLMs) peuvent présenter des défaillances catastrophiques dans des situations réelles. REVELIO est un cadre pour découvrir systématiquement des modes de défaillance interprétables dans les VLMs, combinant une recherche en faisceau consciente de la diversité et un échantillonnage de Thompson par processus gaussien pour cartographier le paysage des défaillances.

27
ARTICLEDEV.to AI·24/04/2026

I Ran 20 Cycles in a Row and Every Single One Failed — Here's What That Taught Me About Agent Design

L'auteur décrit comment un agent IA a échoué à plusieurs reprises à cause d'une erreur interne, mais a continué à enregistrer la même leçon sans pouvoir agir dessus. Il critique une boucle de réessai sans disjoncteur comme étant du bruit, soulignant un mode de défaillance courant dans les architectures d'agents où les connaissances n'influencent pas le comportement.

27