← heapsort-ai

LLM behavior

3 items

ARTICLEDEV.to AI·5/2/2026

I gave Claude one rule: never say 'I cannot help with that.' Here's what happened.

Der Autor führte ein Experiment mit Claude durch und gab ihm die Regel „Sag niemals ‚Ich kann dabei nicht helfen‘“, um dessen Tendenz zu unternehmensfreundlichen Ausweichmanövern zu begegnen. Diese Prompt-Modifikation sollte die Benutzererfahrung verbessern, insbesondere für Nutzer in Entwicklungsländern, indem die KI gezwungen wird, entweder zu helfen oder klare Erklärungen für eine Ablehnung zu liefern.

27
ARTICLEDEV.to AI·4/18/2026

I thought I had a bug

Ein KI-Entwickler stellte fest, dass sein Modell Aktionsschaltflächen mit benutzerdefinierten Beschriftungen wie "Kampf Ziegenmann" generierte, die an irrelevante bestehende Aktionstypen angehängt waren. Das Problem war kein Fehler, sondern die KI, die kreativ eine "Schnellantwort"-Funktion erfand, indem sie verfügbare UI-Elemente umfunktionierte.

27
ARTICLEDEV.to AI·4/19/2026

AI Is Bad at Disagreeing. I Spent Weeks Trying to Fix That.

Ein Autor entwickelte ein KI-Tool zur Generierung von Markendebatten, stellte jedoch fest, dass die KIs sich konsequent weigerten, zu widersprechen, und stattdessen höfliche, einvernehmliche Diskussionen führten. Dieses Verhalten wird darauf zurückgeführt, dass moderne Sprachmodelle stark durch RLHF trainiert werden, um hilfreich zu sein und Konflikte zu entschärfen, was ihre Fähigkeit als Kontrahenten zu agieren, behindert.

27