LLM security

10 items

ARTICLEDEV.to AI·vor 4T

CrewAI Just Added Native Memory Protection — Here's What That Means for Agent Security

CrewAI hat einen nativen Speicherschutz in seine Agentenkonfiguration integriert, um die Sicherheit vor Injektionen in persistenten Agentenspeichern zu erhöhen. Diese wichtige Funktion zielt darauf ab, die Eskalation von Berechtigungen und die Datenexfiltration zu verhindern und adressiert somit kritische OWASP Top 10 Risiken für LLMs.

CrewAI security LLM security memory protection

ARTICLEDEV.to AI·4/19/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Dieser Inhalt identifiziert zwei Probleme bei der DM-Härtung in KI-Systemen, wobei der Schwerpunkt auf dem Sicherheitsaspekt liegt, bei dem feindliche DMs die LLM-Argumentation ausnutzen, um unautorisierte Aktionen auszulösen. Er stellt die Lösung von `v0.21` vor: eine Provenienzschicht, die Aktionen basierend auf dem DM-Ursprung statt auf dem Inhalt validiert.

vulnerability system hardening LLM security direct messages

ARTICLEDEV.to AI·4/19/2026

Your WAF thinks in ATT&CK. Your LLM app needs ATLAS. Here's the bridge.

Herkömmliche Webanwendungs-Sicherheitstaxonomien wie MITRE ATT&CK decken neue, spezifische Bedrohungen von LLMs, wie Prompt Injection oder Jailbreaks, nicht ab. MITRE ATLAS wurde entwickelt, um diese Lücke zu schließen und bietet einen standardisierten Rahmen für Bedrohungen in KI/ML-Systemen.

MITRE ATLAS threat intelligence LLM security prompt injection

ARTICLEDEV.to AI·4/15/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

Prompt Injection ist eine Sicherheitslücke, bei der nicht vertrauenswürdige Eingaben von einem LLM als Anweisungen interpretiert werden, wodurch Angreifer das Systemverhalten überschreiben können. Effektive Prävention erfordert eine Vor-LLM-Bereinigung der Benutzereingaben durch Validierung und Filterung, idealerweise mittels statischer Code-Analyse statt nur Laufzeitfiltern.

Pre-LLM Sanitization LLM security prompt injection Input Validation

ARTICLEDEV.to AI·vor 15T

Anthropic Claude Breach? Engineering Lessons from a Hypothetical 16M‑Conversation Leak

Dieser Artikel untersucht technische Lehren aus einem hypothetischen Leak von 16 Millionen Anthropic Claude-Konversationen und betont LLMs als eigenständige Angriffsfläche. Er hebt hervor, dass Bedrohungsgrenzen nun auch Drittanbieterumgebungen und umfangreiche Protokolle umfassen, wodurch eine Chat-Verletzung zu einer Geschäftsverletzung wird.

Anthropic Claude security AI vulnerabilities data breach

ARTICLEDEV.to AI·5/7/2026

AI Red Team Testing Is Becoming Critical for Modern AI Systems

Da KI-Systeme schnell in Unternehmensabläufe integriert werden, wird Sicherheit zu einem kritischen Anliegen. KI-Red-Team-Tests sind unerlässlich, um Schwachstellen und neue Angriffsflächen zu identifizieren, die traditionelle Testmethoden bei dynamischen Modellen nicht erfassen können.

security red team testing LLM security Enterprise AI

ARTICLEDEV.to AI·4/20/2026

MCP Security in 2026: How to Protect Your AI Agents from Prompt Injection

Dieser Artikel untersucht das Risiko indirekter Prompt-Injektionen in KI-Agenten wie Claude Desktop, die externe Tools über das Model Context Protocol (MCP) nutzen. Er erläutert, wie Tool-Ausgaben zu Angriffsvektoren werden können, und bietet Code-Lösungen zur Implementierung von Injektionsscans.

LLM security prompt injection AI security AI agents

DOCDEV.to AI·4/16/2026

How to Secure Claude CLI When It Runs Inside Your Software (don't ask)

Dieser Inhalt erklärt, wie die Claude CLI sicher betrieben wird, wenn sie serverseitig in Ihrer Software läuft, um Prompt-Injection-Risiken zu begegnen. Es werden Sicherheitsmechanismen wie `--print` und `--bare` beschrieben, um interaktive Tools zu deaktivieren und den verfügbaren Kontext für das Modell zu reduzieren.

LLM security prompt injection application security AI security

ARTICLEDEV.to AI·4/19/2026

TEOS Sentinel Shield: Blocking Unsafe AI Code Before Execution

TEOS Sentinel Shield ist eine KI-Ausführungs-Firewall, die unsicheren KI-Code, einschließlich LLM-generierter Skripte, vor der Ausführung blockiert. Sie analysiert über 14 Risikomuster in unter 2 Sekunden und liefert klare ZULASSEN/WARNEN/BLOCKIEREN-Entscheidungen, um Systemkompromittierungen zu verhindern.

LLM security Code Analysis risk management AI security

NEWSDEV.to AI·4/15/2026

AI Wargame at NDC Sydney & Black Hat Asia

Wir kündigen bevorstehende Workshops bei NDC Sydney 2026 und Black Hat Asia an, die sich auf KI-Sicherheit konzentrieren, wobei LLM-Schwachstellen und sichere Designmuster erforscht werden. Dies beinhaltet ein intensives KI-Angriffs- und Verteidigungs-Wargame, bei dem Teilnehmer KI-Chatbots sichern und angreifen.

cybersecurity Wargame OWASP LLM Top 10 LLM security