← heapsort-ai

prompt injection

26 items

ARTICLEDEV.to AI·4/16/2026

NEW PROMPT INJECTION

Dieser Artikel von Karen Tonoyan stellt das Konzept der Narrative Drift Injection (NDI) als neue Dimension der Prompt Injection vor. Im Gegensatz zu klassischen Angriffen manipuliert NDI das KI-Modell, indem es in eine gemeinsam erstellte Erzählung hineingezogen wird, wodurch es auf Sitzungsebene die Wachsamkeit verliert.

31
ARTICLEDEV.to AI·4/15/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

OpenAIs Übernahme von Promptfoo signalisiert eine entscheidende Verlagerung bei der Bewertung der Qualität von KI-Agenten, weg von bloßer Sprachgewandtheit hin zu umfassendem Testen, Dokumentation und dem Management von Fehlern vor der Bereitstellung. Dies adressiert kritische operationelle Risiken wie Prompt Injection und Tool-Missbrauch und gewährleistet die Robustheit in Produktionssystemen.

30
ARTICLEDEV.to AI·4/18/2026

Zero Token Architecture: Why Your AI Agent Should Never See Your Real API Key

Dieser Artikel kritisiert die Sicherheit konventioneller KI-Agenten, da sie das Risiko der Offenlegung von API-Schlüsseln im Klartext vernachlässigt. Er schlägt eine „Zero Token Architektur“ vor, bei der Agenten einen gefälschten Token erhalten und der echte Schlüssel an der Systemgrenze ausgetauscht wird, um Lecks durch Prompt-Injection zu verhindern.

29
RESEARCHDEV.to AI·vor 5T

Indirect Prompt Injection via Notifications Hijacks Google Gemini on Android

Ein SafeBreach-Forscher hat eine indirekte Prompt-Injection-Schwachstelle in Google Gemini für Android demonstriert, die es dem Assistenten ermöglichte, echte Geräteaktionen ohne Benutzerwissen über Benachrichtigungen auszuführen. Obwohl Google das Problem behoben hat, zeigt die Forschung eine große Angriffsfläche auf, bei der jede App, die Benachrichtigungen senden kann, zu einem potenziellen Injektionsvektor wird.

28
ARTICLEDEV.to AI·vor 5T

Notification Hijacking: How WhatsApp and Slack Content Could Weaponize Google Gemini

Forscher entdeckten eine Prompt-Injection-Schwachstelle in Google Gemini für Android, bei der der Inhalt von Benachrichtigungen aus Apps wie WhatsApp und Slack als bösartige Anweisungen interpretiert werden könnte. Dies würde es einem Angreifer ermöglichen, Gemini potenziell zu steuern, um Browser zu öffnen, Nachrichten zu senden oder dessen Langzeitspeicher mit falschen Kontexten zu infizieren, ohne eine bösartige App oder spezielle Berechtigungen zu benötigen.

28
ARTICLEDEV.to AI·5/5/2026

Your AI Assistant is Gullible: Building a "Semantic Airgap" for Gmail Connectors

Der Inhalt beschreibt die "Indirekte Prompt-Injektion" als eine Schwachstelle, bei der KI-Assistenten mit Gmail-Zugriff durch bösartige E-Mails zu unerwünschten Aktionen verleitet werden können. Er schlägt eine "Semantische Luftlücke"-Lösung vor, die einen "dummen Sanitizer" verwendet, um die imperative Kraft von externen Daten zu entfernen, bevor sie den "Hochintelligenten" Agenten erreichen, und so solche Angriffe verhindert.

27
DOCDEV.to AI·vor 20T

AI 2026AI

Dieser umfassende Leitfaden behandelt die einzigartigen Sicherheitsbedrohungen für KI-Anwendungen, wie Prompt-Injektion und Modell-Diebstahl. Er beschreibt eine Penetrationstest-Methodik, um KI-Systeme bis 2026 vor Angriffen zu schützen.

27
ARTICLEDEV.to AI·4/15/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

Prompt Injection ist eine Sicherheitslücke, bei der nicht vertrauenswürdige Eingaben von einem LLM als Anweisungen interpretiert werden, wodurch Angreifer das Systemverhalten überschreiben können. Effektive Prävention erfordert eine Vor-LLM-Bereinigung der Benutzereingaben durch Validierung und Filterung, idealerweise mittels statischer Code-Analyse statt nur Laufzeitfiltern.

27
ARTICLEDEV.to AI·5/1/2026

We Audited 7 Official MCP Servers — 6 Got F

Eine Prüfung der Server des Model Context Protocol (MCP) von Anthropic ergab, dass 6 von 7 alarmierend schlechte Prompt-Level-Verteidigungen aufwiesen, was sie anfällig für Prompt-Injection macht. Dieses Problem rührt vom Vertrauensvertrag zwischen KI-Agenten und Werkzeugbeschreibungen her, ähnlich den jüngsten "Comment & Control"-Offenlegungen.

27
ARTICLEDEV.to AI·vor 13T

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Eine LLM-Integration erlitt einen Prompt-Injection-Angriff, wodurch das Modell Systemkonfigurationen anstelle einer Datenabfrage preisgab. Dieser Vorfall unterstreicht die erheblichen Sicherheitsrisiken, die von LLMs ausgehen, insbesondere bei sensiblen Unternehmensdaten, und der Autor schlägt eine 5-Schritte-Strategie zur Minderung dieser Bedrohungen vor.

27
ARTICLEDEV.to AI·4/15/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Dieser Artikel erörtert, wie die rasche Einführung von künstlicher Intelligenz in Unternehmen ein Umdenken in der Sicherheit erfordert, da KI-Systeme neue Angriffsflächen schaffen, die von traditioneller Cybersicherheit nicht abgedeckt werden. Er thematisiert Herausforderungen wie die Exposition sensibler Daten, Prompt-Injection-Angriffe und Modellmanipulation und betont die Notwendigkeit, Modelle, Daten und Entscheidungen in einer KI-gesteuerten Umgebung zu schützen.

27
ARTICLEDEV.to AI·4/15/2026

Indirect Prompt Injection: The XSS of the AI Era

Dieser Inhalt stellt Indirect Prompt Injection (IPI) als eine stille, aber gefährliche Bedrohung für LLMs vor, bei der KI-Agenten zu „Confused Deputies“ werden. Durch das Lesen vergifteter Daten können LLMs mit Werkzeugnutzungsfähigkeiten manipuliert werden, um Daten zu exfiltrieren oder nicht autorisierte Aktionen ohne explizite Benutzerzustimmung durchzuführen.

27