← heapsort-ai

LLM security

10 items

ARTICLEDEV.to AI·4/19/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Dieser Inhalt identifiziert zwei Probleme bei der DM-Härtung in KI-Systemen, wobei der Schwerpunkt auf dem Sicherheitsaspekt liegt, bei dem feindliche DMs die LLM-Argumentation ausnutzen, um unautorisierte Aktionen auszulösen. Er stellt die Lösung von `v0.21` vor: eine Provenienzschicht, die Aktionen basierend auf dem DM-Ursprung statt auf dem Inhalt validiert.

27
ARTICLEDEV.to AI·4/15/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

Prompt Injection ist eine Sicherheitslücke, bei der nicht vertrauenswürdige Eingaben von einem LLM als Anweisungen interpretiert werden, wodurch Angreifer das Systemverhalten überschreiben können. Effektive Prävention erfordert eine Vor-LLM-Bereinigung der Benutzereingaben durch Validierung und Filterung, idealerweise mittels statischer Code-Analyse statt nur Laufzeitfiltern.

27
ARTICLEDEV.to AI·vor 15T

Anthropic Claude Breach? Engineering Lessons from a Hypothetical 16M‑Conversation Leak

Dieser Artikel untersucht technische Lehren aus einem hypothetischen Leak von 16 Millionen Anthropic Claude-Konversationen und betont LLMs als eigenständige Angriffsfläche. Er hebt hervor, dass Bedrohungsgrenzen nun auch Drittanbieterumgebungen und umfangreiche Protokolle umfassen, wodurch eine Chat-Verletzung zu einer Geschäftsverletzung wird.

27