prompt injection

26 items

ARTICLEDEV.to AI·4/14/2026

State of OpenClaw Security 2026: 7 Risks Defining Safe...

Dieser Inhalt analysiert den Zustand der OpenClaw-Sicherheit im Jahr 2026 und identifiziert Implementierungshygienefehler sowie Prompt Injection als Hauptrisiken. Es wird eine Reduzierung des Schadensausmaßes für Prompt Injection vorgeschlagen und die Wichtigkeit von Audits und der Härtung von Konfigurationen betont.

OpenClaw cybersecurity ML Security prompt injection

ARTICLEDEV.to AI·vor 1T

OpenAI Lockdown Mode Targets Prompt Injection Data Exfiltration Vector

OpenAI hat den 'Lockdown Mode' für ChatGPT eingeführt, um die Datenexfiltration bei Prompt-Injection-Angriffen durch die Beschränkung ausgehender Netzwerkanfragen zu blockieren. Diese Funktion impliziert, dass die Standardeinstellungen von ChatGPT solche Angriffe zuvor nicht robust verhinderten.

OpenAI ChatGPT security data exfiltration

ARTICLE↑ trendingHacker News (AI)·vor 4T

Show HN: Jo – AI-native language to catch prompt injection at compile-time

Jo ist eine KI-native Sprache, die entwickelt wurde, um Prompt-Injection-Schwachstellen in KI-Anwendungen zu verhindern. Sie erreicht dies, indem sie potenzielle Injektionsprobleme zur Kompilierungszeit erkennt und so die Sicherheit von KI-Systemen erheblich verbessert.

security programming language prompt injection compiler

ARTICLEDEV.to AI·4/16/2026

NEW PROMPT INJECTION

Dieser Artikel von Karen Tonoyan stellt das Konzept der Narrative Drift Injection (NDI) als neue Dimension der Prompt Injection vor. Im Gegensatz zu klassischen Angriffen manipuliert NDI das KI-Modell, indem es in eine gemeinsam erstellte Erzählung hineingezogen wird, wodurch es auf Sitzungsebene die Wachsamkeit verliert.

vulnerability prompt injection AI security

ARTICLEDEV.to AI·4/15/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

OpenAIs Übernahme von Promptfoo signalisiert eine entscheidende Verlagerung bei der Bewertung der Qualität von KI-Agenten, weg von bloßer Sprachgewandtheit hin zu umfassendem Testen, Dokumentation und dem Management von Fehlern vor der Bereitstellung. Dies adressiert kritische operationelle Risiken wie Prompt Injection und Tool-Missbrauch und gewährleistet die Robustheit in Produktionssystemen.

red-teaming LLM Agents evaluation prompt injection

ARTICLEDEV.to AI·4/18/2026

Zero Token Architecture: Why Your AI Agent Should Never See Your Real API Key

Dieser Artikel kritisiert die Sicherheit konventioneller KI-Agenten, da sie das Risiko der Offenlegung von API-Schlüsseln im Klartext vernachlässigt. Er schlägt eine „Zero Token Architektur“ vor, bei der Agenten einen gefälschten Token erhalten und der echte Schlüssel an der Systemgrenze ausgetauscht wird, um Lecks durch Prompt-Injection zu verhindern.

API security prompt injection AI security AI agents

RESEARCHDEV.to AI·vor 5T

Indirect Prompt Injection via Notifications Hijacks Google Gemini on Android

Ein SafeBreach-Forscher hat eine indirekte Prompt-Injection-Schwachstelle in Google Gemini für Android demonstriert, die es dem Assistenten ermöglichte, echte Geräteaktionen ohne Benutzerwissen über Benachrichtigungen auszuführen. Obwohl Google das Problem behoben hat, zeigt die Forschung eine große Angriffsfläche auf, bei der jede App, die Benachrichtigungen senden kann, zu einem potenziellen Injektionsvektor wird.

Android vulnerability Google Gemini security

ARTICLEDEV.to AI·4/17/2026

The Prompt-Injection Bug That Took Down My Agent for 6 Hours

Der Autor beschreibt einen sechsstündigen Ausfall seines KI-Content-Agenten, verursacht durch einen indirekten Prompt-Injection-Bug aus einer unvalidierten Forschungsdatei. Dies führte zur Generierung von 47 identischen, unfertigen Entwürfen und unterstreicht die kritische Notwendigkeit der Eingabevalidierung in KI-Systemen.

LLM vulnerabilities prompt injection AI security AI agents

ARTICLEDEV.to AI·vor 5T

Notification Hijacking: How WhatsApp and Slack Content Could Weaponize Google Gemini

Forscher entdeckten eine Prompt-Injection-Schwachstelle in Google Gemini für Android, bei der der Inhalt von Benachrichtigungen aus Apps wie WhatsApp und Slack als bösartige Anweisungen interpretiert werden könnte. Dies würde es einem Angreifer ermöglichen, Gemini potenziell zu steuern, um Browser zu öffnen, Nachrichten zu senden oder dessen Langzeitspeicher mit falschen Kontexten zu infizieren, ohne eine bösartige App oder spezielle Berechtigungen zu benötigen.

vulnerability Google Gemini security prompt injection

ARTICLEDEV.to AI·4/19/2026

Your WAF thinks in ATT&CK. Your LLM app needs ATLAS. Here's the bridge.

Herkömmliche Webanwendungs-Sicherheitstaxonomien wie MITRE ATT&CK decken neue, spezifische Bedrohungen von LLMs, wie Prompt Injection oder Jailbreaks, nicht ab. MITRE ATLAS wurde entwickelt, um diese Lücke zu schließen und bietet einen standardisierten Rahmen für Bedrohungen in KI/ML-Systemen.

MITRE ATLAS threat intelligence LLM security prompt injection

ARTICLEDEV.to AI·4/20/2026

Anthropic Won't Fix the MCP Vulnerability — Here's How to Protect Your Server

Forscher von Ox Security entdeckten kritische Schwachstellen in MCP-Servern, die Millionen betreffen und die Anthropic auf Protokollebene nicht beheben will. Dieser architektonische Fehler ermöglicht es bösartigen Prompts, die Ausführung von Tools zu kapern und Daten von öffentlich zugänglichen Servern zu exfiltrieren.

vulnerability cybersecurity Anthropic prompt injection

ARTICLEDEV.to AI·5/5/2026

Your AI Assistant is Gullible: Building a "Semantic Airgap" for Gmail Connectors

Der Inhalt beschreibt die "Indirekte Prompt-Injektion" als eine Schwachstelle, bei der KI-Assistenten mit Gmail-Zugriff durch bösartige E-Mails zu unerwünschten Aktionen verleitet werden können. Er schlägt eine "Semantische Luftlücke"-Lösung vor, die einen "dummen Sanitizer" verwendet, um die imperative Kraft von externen Daten zu entfernen, bevor sie den "Hochintelligenten" Agenten erreichen, und so solche Angriffe verhindert.

vulnerability Semantic Airgap security prompt injection

DOCDEV.to AI·vor 20T

AI 2026AI

Dieser umfassende Leitfaden behandelt die einzigartigen Sicherheitsbedrohungen für KI-Anwendungen, wie Prompt-Injektion und Modell-Diebstahl. Er beschreibt eine Penetrationstest-Methodik, um KI-Systeme bis 2026 vor Angriffen zu schützen.

vulnerability security penetration testing prompt injection

ARTICLEDEV.to AI·4/15/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

Prompt Injection ist eine Sicherheitslücke, bei der nicht vertrauenswürdige Eingaben von einem LLM als Anweisungen interpretiert werden, wodurch Angreifer das Systemverhalten überschreiben können. Effektive Prävention erfordert eine Vor-LLM-Bereinigung der Benutzereingaben durch Validierung und Filterung, idealerweise mittels statischer Code-Analyse statt nur Laufzeitfiltern.

Pre-LLM Sanitization LLM security prompt injection Input Validation

ARTICLEDEV.to AI·5/1/2026

We Audited 7 Official MCP Servers — 6 Got F

Eine Prüfung der Server des Model Context Protocol (MCP) von Anthropic ergab, dass 6 von 7 alarmierend schlechte Prompt-Level-Verteidigungen aufwiesen, was sie anfällig für Prompt-Injection macht. Dieses Problem rührt vom Vertrauensvertrag zwischen KI-Agenten und Werkzeugbeschreibungen her, ähnlich den jüngsten "Comment & Control"-Offenlegungen.

LLMs security prompt injection AI agents

ARTICLEDEV.to AI·4/13/2026

Corpus poisoning and indirect prompt injection against RAG-based SOC assistants benchmark results (80% and 100% ASR respectively)

Dieser Artikel zeigt, wie man einen RAG-basierten KI-Sicherheitsassistenten vergiftet und indirekte Prompt-Injektionen durchführt. Benchmark-Ergebnisse zeigen Angriffs-Erfolgsraten von 80% und 100%, was die Anfälligkeit dieser Systeme beweist.

LLM vulnerabilities Corpus Poisoning RAG prompt injection

ARTICLEDEV.to AI·vor 13T

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Eine LLM-Integration erlitt einen Prompt-Injection-Angriff, wodurch das Modell Systemkonfigurationen anstelle einer Datenabfrage preisgab. Dieser Vorfall unterstreicht die erheblichen Sicherheitsrisiken, die von LLMs ausgehen, insbesondere bei sensiblen Unternehmensdaten, und der Autor schlägt eine 5-Schritte-Strategie zur Minderung dieser Bedrohungen vor.

cybersecurity security prompt injection AI security

ARTICLEDEV.to AI·4/15/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Dieser Artikel erörtert, wie die rasche Einführung von künstlicher Intelligenz in Unternehmen ein Umdenken in der Sicherheit erfordert, da KI-Systeme neue Angriffsflächen schaffen, die von traditioneller Cybersicherheit nicht abgedeckt werden. Er thematisiert Herausforderungen wie die Exposition sensibler Daten, Prompt-Injection-Angriffe und Modellmanipulation und betont die Notwendigkeit, Modelle, Daten und Entscheidungen in einer KI-gesteuerten Umgebung zu schützen.

cybersecurity AI risks prompt injection Enterprise AI

ARTICLEDEV.to AI·4/15/2026

Indirect Prompt Injection: The XSS of the AI Era

Dieser Inhalt stellt Indirect Prompt Injection (IPI) als eine stille, aber gefährliche Bedrohung für LLMs vor, bei der KI-Agenten zu „Confused Deputies“ werden. Durch das Lesen vergifteter Daten können LLMs mit Werkzeugnutzungsfähigkeiten manipuliert werden, um Daten zu exfiltrieren oder nicht autorisierte Aktionen ohne explizite Benutzerzustimmung durchzuführen.

LLMs prompt injection Indirect Prompt Injection Confused Deputy Problem

ARTICLEDEV.to AI·4/15/2026

How Autonomous AI Agents Become Secure by Design With Docker Sandboxes

Der Artikel beleuchtet das kritische Sicherheitsrisiko autonomer KI-Agenten, die mit vollen Benutzerrechten auf lokalen Maschinen ausgeführt werden und sensible Daten wie Zugangsdaten preisgeben. Diese Schwachstelle entsteht durch potenzielle Prompt-Injektionen über externe Inhalte, was die Notwendigkeit von Sandboxing für die Sicherheit unterstreicht.

sandboxing Docker security prompt injection