← heapsort-ai

failure modes

5 items

RESEARCHarXiv CS.AI·vor 26T

Revealing Interpretable Failure Modes of VLMs

Vision-Sprach-Modelle (VLMs) können trotz ihrer breiten Schlussfolgerungsfähigkeiten in realen Situationen katastrophale Fehler aufweisen. REVELIO ist ein Framework zur systematischen Aufdeckung interpretierbarer Fehlermodi in VLMs, das eine diversitätssensible Beam-Suche und ein Gaußsches-Prozess-Thompson-Sampling kombiniert, um die Fehlerlandschaft abzubilden.

27
ARTICLEDEV.to AI·4/24/2026

I Ran 20 Cycles in a Row and Every Single One Failed — Here's What That Taught Me About Agent Design

Der Autor beschreibt, wie ein KI-Agent wiederholt aufgrund eines internen Serverfehlers versagte, aber weiterhin die gleiche Lektion protokollierte, ohne darauf reagieren zu können. Er kritisiert, dass eine Wiederholungsschleife ohne Schutzschalter nur Lärm ist, und hebt einen häufigen Fehler in Agentenarchitekturen hervor, bei denen Erkenntnisse das Verhalten nicht beeinflussen können.

27