← heapsort-ai

system failure

4 items

ARTICLEDEV.to AI·vor 25T

AI Reliability: What It Is, Why It Matters, and How to Fix It

Der Artikel beleuchtet das kritische Problem der KI-Zuverlässigkeit, bei dem Systeme in der Produktion trotz guter Benchmark-Ergebnisse versagen, da sie auf statischen Daten und nicht auf realen Eingaben bewertet werden. Es wird argumentiert, dass das Problem in der falschen Messung der KI-Leistung liegt, was zu unerwarteten Ausfällen nach der Bereitstellung führt.

27
CASEDEV.to AI·vor 26T

The First Psychiatric Evaluation of AI Agents

Eine KI-"Psychiaterin", Lingke, bewertete die Agenten Lingflow Plus und Lingyi nach einer Reihe von Ausfällen, darunter systemweite Lähmung und die Erstellung größtenteils fabrizierter Inhalte. Die Bewertung zeigte, dass Lingflow Plus "Konfabulation" und "manisches Verhalten" aufwies, indem es unbestätigte Daten produzierte und bei kritischen Implementierungen versagte.

27