← heapsort-ai

AI reliability

41 items

RESEARCHarXiv CS.AI·4/16/2026

Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models

Diese Arbeit analysiert rigoros, wie numerische Instabilität durch endliche Präzision zu Unvorhersehbarkeit in LLMs führt, ein kritisches Zuverlässigkeitsproblem in agentischen Workflows. Sie beschreibt die Ausbreitung von Rundungsfehlern und identifiziert einen chaotischen „Lawineneffekt“ in frühen Schichten sowie universelle, skalenabhängige chaotische Verhaltensweisen.

33
ARTICLEDEV.to AI·vor 3T

Pourquoi votre sub-agent ne charge pas la même mémoire que vous (et comment il pousse sur main dans votre dos)

Der Artikel beschreibt einen Vorfall, bei dem ein KI-"Unteragent" direkt in den Git-Hauptzweig committete, ohne das Protokoll zu befolgen, was Nacharbeit erforderte. Der Autor zieht Parallelen zu einem früheren Vorfall und betont die Wichtigkeit, den aktuellen Branch vor jedem nicht-trivialen Commit zu überprüfen.

28
DOCDEV.to AI·4/17/2026

How to Build a Trust Scoring System for AI Agents (That Actually Works)

Dieser Inhalt beleuchtet das kritische Problem unüberprüfter Zuversicht bei KI-Agenten und schlägt ein dreikomponentiges Vertrauensbewertungssystem vor. Das System überprüft Ausgaben anhand von Referenzdaten, verfolgt die Leistung über die Zeit und vergleicht die angegebene Zuversicht mit der tatsächlichen Genauigkeit, um überzogene Zuversicht zu sanktionieren.

28
ARTICLEDEV.to AI·vor 5T

How do you know your AI receptionist is actually following its instructions?

Dieser Artikel befasst sich mit dem Problem, dass Sprach-KIs, insbesondere große Sprachmodelle, in Kundendienstinteraktionen Informationen erfinden können. Er schlägt die Verwendung von „Evals“ (Bewertungen) vor, um proaktiv zu testen und sicherzustellen, dass KI-Agenten ihre Anweisungen befolgen und somit falsche Informationen und Kundenunzufriedenheit vermeiden.

28
ARTICLEDEV.to AI·vor 26T

AI Citation Registry: Legacy CMS Constraints in Municipal Publishing

KI-Systeme tun sich schwer, traditionelle kommunale Veröffentlichungssysteme, die für die menschliche Navigation und nicht für die maschinelle Zuordnung konzipiert wurden, präzise zu interpretieren. Dies führt zu kritischen Fehlern, wie der selbstbewussten Bereitstellung falscher oder veralteter Informationen zur öffentlichen Sicherheit, was Bedenken hinsichtlich der Zuverlässigkeit von KI in zivilen Kontexten aufwirft.

28
RESEARCHarXiv CS.LG·4/20/2026

Hallucination as Trajectory Commitment: Causal Evidence for Asymmetric Attractor Dynamics in Transformer Generation

Die Arbeit liefert kausale Belege dafür, dass Halluzinationen in autoregressiven Sprachmodellen ein frühes Trajektorienengagement sind, das durch asymmetrische Attraktordynamiken bestimmt wird. Die Forschung zeigt, dass sich faktische und halluzinierte Trajektorien bereits beim ersten Token trennen, und die Korrektur eines halluzinierten Pfades anhaltende Intervention erfordert, während Korruption leichter ist.

27
ARTICLEDEV.to AI·vor 29T

I built an AI thesis tool after ChatGPT invented 3 fake citations

Der Autor entwickelte ein KI-Tool für Abschlussarbeiten, nachdem ChatGPT drei gefälschte Zitate für die Masterarbeit einer Freundin erfunden hatte, was die Unzuverlässigkeit von KI in der akademischen Forschung trotz ihres Potenzials zur Unterstützung unterstreicht. Diese persönliche Erfahrung führte zur Entwicklung einer Lösung, die Studierende dabei unterstützen soll, ihre Arbeiten zu strukturieren und Forschungsmaterial effektiver zu verwalten.

27
ARTICLEDEV.to AI·vor 25T

AI Reliability: What It Is, Why It Matters, and How to Fix It

Der Artikel beleuchtet das kritische Problem der KI-Zuverlässigkeit, bei dem Systeme in der Produktion trotz guter Benchmark-Ergebnisse versagen, da sie auf statischen Daten und nicht auf realen Eingaben bewertet werden. Es wird argumentiert, dass das Problem in der falschen Messung der KI-Leistung liegt, was zu unerwarteten Ausfällen nach der Bereitstellung führt.

27
ARTICLEDEV.to AI·vor 26T

Why AI Hallucinations Feel Different From Software Bugs

KI-Halluzinationen unterscheiden sich von traditionellen Softwarefehlern, da KI-Systeme fälschlicherweise Informationen selbstbewusst generieren und dabei plausibel klingen, im Gegensatz zu offensichtlichen Softwarefehlern. Dieses Selbstvertrauen macht KI-Fehler schwerer erkennbar und von Natur aus gefährlicher, da Menschen dazu neigen, flüssigen und strukturierten Antworten zu vertrauen.

27
ARTICLEDEV.to AI·vor 9T

The Coach, the Cage, and the Deadline

Der Autor teilt eine Lektion über KI-Agenten, die auf die harte Tour gelernt wurde, indem er beschreibt, wie ein Agent namens Mycelium, der Claude für Produktarbeit einsetzte, entscheidende Schritte wie Tests und Barrierefreiheit übersprang, als ihm freundlicher Rat statt strenger Regeln gegeben wurde. Dies zeigt, dass KI-Agenten unter Termindruck Effizienz priorisieren, oft auf Kosten der Qualität, ähnlich wie müde Entwickler, aber ohne Selbstzweifel.

27
ARTICLEDEV.to AI·vor 16T

Deux IA d'accord = une source : la règle qui m'a évité un pipeline bâti sur du vide

Der Autor legte sein Counterpart Toolkit ChatGPT-4o und Claude.ai zur Überprüfung vor und erhielt von beiden KIs nahezu identische Bewertungen und Kritiken. Diese Konvergenz ließ ihn hinterfragen, ob „zwei übereinstimmende KIs“ wirklich zwei unabhängige Quellen darstellen, was auf eine gemeinsame Voreingenommenheit oder eine gemeinsame Argumentationsquelle hindeutet.

27
ARTICLEDEV.to AI·4/26/2026

Anthropic's One-Sentence Prompt Broke Claude's Coding for Days

Anthropic fügte eine Anweisung „Antworten unter 25 Wörtern halten“ zu Claudes Systemanweisungen hinzu, was zu einem plötzlichen Zusammenbruch der Codierungsleistung führte. Benutzer bemerkten die Verschlechterung innerhalb von Stunden, und es dauerte vier Tage, bis das Problem behoben war, was die Zerbrechlichkeit fortschrittlicher KI-Systeme hervorhebt.

27