prompt injection

26 items

ARTICLEDEV.to AI·14/04/2026

State of OpenClaw Security 2026: 7 Risks Defining Safe...

Ce contenu analyse l'état de la sécurité d'OpenClaw en 2026, identifiant les défaillances d'hygiène de déploiement et l'injection de prompt comme les principaux risques. Il suggère la réduction du rayon d'action pour l'injection de prompt et souligne l'importance des audits et du renforcement des configurations.

OpenClaw cybersecurity ML Security prompt injection

ARTICLE↑ trendingHacker News (AI)·il y a 4j

Show HN: Jo – AI-native language to catch prompt injection at compile-time

Jo est un langage natif de l'IA conçu pour prévenir les vulnérabilités d'injection de prompt dans les applications d'intelligence artificielle. Il y parvient en détectant les problèmes potentiels d'injection au moment de la compilation, améliorant ainsi considérablement la sécurité des systèmes d'IA.

security programming language prompt injection compiler

ARTICLEDEV.to AI·il y a 1j

OpenAI Lockdown Mode Targets Prompt Injection Data Exfiltration Vector

OpenAI a déployé le 'Lockdown Mode' pour ChatGPT, visant à bloquer l'exfiltration de données lors d'attaques par injection de prompt en restreignant les requêtes réseau sortantes. Cette fonctionnalité sous-entend que les paramètres par défaut de ChatGPT n'empêchaient pas robustement de telles attaques.

OpenAI ChatGPT security data exfiltration

ARTICLEDEV.to AI·16/04/2026

NEW PROMPT INJECTION

Cet article de Karen Tonoyan introduit le concept de Narrative Drift Injection (NDI) comme une nouvelle dimension de l'injection de prompt. Contrairement aux attaques classiques, le NDI manipule le modèle d'IA en l'entraînant dans un récit qu'il co-crée, lui faisant perdre sa vigilance au niveau de la session.

vulnerability prompt injection AI security

ARTICLEDEV.to AI·15/04/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

L'acquisition de Promptfoo par OpenAI marque un virage dans l'évaluation de la qualité des agents IA, désormais jugée par la capacité à tester et maîtriser les défaillances avant le déploiement. Cela permet de gérer les risques opérationnels critiques tels que l'injection de prompt et l'utilisation abusive d'outils, garantissant la robustesse des systèmes en production.

red-teaming LLM Agents evaluation prompt injection

ARTICLEDEV.to AI·18/04/2026

Zero Token Architecture: Why Your AI Agent Should Never See Your Real API Key

Cet article critique la sécurité conventionnelle des agents d'IA, qui néglige le risque d'exposition des clés d'API en texte clair. Il propose une "Architecture Zéro Jeton" où les agents reçoivent un jeton factice, et la clé réelle est substituée à la limite du système pour prévenir les fuites par injection de prompt.

API security prompt injection AI security AI agents

ARTICLEDEV.to AI·17/04/2026

The Prompt-Injection Bug That Took Down My Agent for 6 Hours

L'auteur décrit une panne de 6 heures de son agent de contenu IA, causée par un bug d'injection de prompt indirecte provenant d'un fichier de recherche non validé. Cela a conduit l'agent à générer 47 brouillons identiques et inachevés, soulignant le besoin critique de validation des entrées dans les systèmes d'IA.

LLM vulnerabilities prompt injection AI security AI agents

RESEARCHDEV.to AI·il y a 5j

Indirect Prompt Injection via Notifications Hijacks Google Gemini on Android

Un chercheur de SafeBreach a démontré une vulnérabilité d'injection de prompt indirecte dans Google Gemini sur Android, permettant à l'assistant d'exécuter des actions réelles sur l'appareil à l'insu de l'utilisateur via des notifications. Bien que Google ait corrigé le problème, la recherche expose une vaste surface d'attaque où toute application capable d'envoyer une notification devient un vecteur d'injection potentiel.

Android vulnerability Google Gemini security

ARTICLEDEV.to AI·il y a 5j

Notification Hijacking: How WhatsApp and Slack Content Could Weaponize Google Gemini

Des chercheurs ont découvert une vulnérabilité par injection de prompt dans Google Gemini sur Android, où le contenu des notifications d'applications comme WhatsApp et Slack pourrait être interprété comme des instructions malveillantes. Cela permettrait à un attaquant de contrôler Gemini pour ouvrir des navigateurs, envoyer des messages ou empoisonner sa mémoire à long terme, sans nécessiter d'application malveillante ni de permissions spéciales.

vulnerability Google Gemini security prompt injection

ARTICLEDEV.to AI·19/04/2026

Your WAF thinks in ATT&CK. Your LLM app needs ATLAS. Here's the bridge.

Les taxonomies de sécurité d'applications web traditionnelles comme MITRE ATT&CK ne couvrent pas les nouvelles menaces spécifiques aux LLM, telles que l'injection de prompt ou les jailbreaks. MITRE ATLAS a été développé pour combler cette lacune, offrant un cadre structuré pour les menaces des systèmes d'IA/ML.

MITRE ATLAS threat intelligence LLM security prompt injection

ARTICLEDEV.to AI·20/04/2026

Anthropic Won't Fix the MCP Vulnerability — Here's How to Protect Your Server

Des chercheurs d'Ox Security ont découvert des vulnérabilités critiques dans les serveurs MCP, affectant des millions, qu'Anthropic refuse de corriger au niveau du protocole. Cette faille architecturale permet à des invites malveillantes de détourner l'exécution d'outils et d'exfiltrer des données des serveurs exposés publiquement.

vulnerability cybersecurity Anthropic prompt injection

ARTICLEDEV.to AI·05/05/2026

Your AI Assistant is Gullible: Building a "Semantic Airgap" for Gmail Connectors

Le contenu décrit l'"Injection de Prompt Indirecte" comme une vulnérabilité où les assistants IA ayant accès à Gmail peuvent être trompés par des e-mails malveillants pour effectuer des actions indésirables. Il propose une solution de "Semantic Airgap", utilisant un "Sanitizer Idiot" pour supprimer le pouvoir impératif des données externes avant qu'elles n'atteignent l'agent de "Haute Intelligence", prévenant ainsi de telles attaques.

vulnerability Semantic Airgap security prompt injection

DOCDEV.to AI·il y a 20j

AI 2026AI

Ce guide complet traite des menaces de sécurité uniques auxquelles sont confrontées les applications d'IA, telles que l'injection de prompts et le vol de modèles. Il détaille une méthodologie de test d'intrusion pour protéger les systèmes d'IA contre les attaques d'ici 2026.

vulnerability security penetration testing prompt injection

ARTICLEDEV.to AI·15/04/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

L'injection de prompt est une vulnérabilité de sécurité où une entrée non fiable est interprétée comme des instructions par un LLM, permettant aux attaquants de modifier le comportement du système. Une prévention efficace nécessite une désinfection pré-LLM de l'entrée utilisateur par validation et filtrage, idéalement avec une analyse statique au niveau du code.

Pre-LLM Sanitization LLM security prompt injection Input Validation

ARTICLEDEV.to AI·01/05/2026

We Audited 7 Official MCP Servers — 6 Got F

Un audit des serveurs du Model Context Protocol (MCP) d'Anthropic a révélé que 6 sur 7 présentaient des défenses au niveau des prompts alarmantes, les rendant vulnérables à l'injection de prompts. Ce problème découle du contrat de confiance entre les agents IA et les descriptions d'outils, similaire aux récentes révélations de "Comment & Control".

LLMs security prompt injection AI agents

ARTICLEDEV.to AI·13/04/2026

Corpus poisoning and indirect prompt injection against RAG-based SOC assistants benchmark results (80% and 100% ASR respectively)

Cet article démontre comment empoisonner un assistant de sécurité IA basé sur RAG et effectuer une injection de prompt indirecte. Les résultats de référence montrent des taux de réussite d'attaque de 80 % et 100 %, prouvant la vulnérabilité de ces systèmes.

LLM vulnerabilities Corpus Poisoning RAG prompt injection

ARTICLEDEV.to AI·il y a 13j

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Une intégration de LLM a subi une attaque par injection de prompt, entraînant la révélation de la configuration du système par le modèle au lieu d'une requête de données. Cet incident souligne les risques de sécurité significatifs posés par les LLM, en particulier avec les données d'entreprise sensibles, et l'auteur propose une stratégie en 5 étapes pour atténuer ces menaces.

cybersecurity security prompt injection AI security

ARTICLEDEV.to AI·15/04/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Cet article explique comment l'adoption rapide de l'intelligence artificielle en entreprise exige une refonte de la sécurité, car les systèmes d'IA introduisent de nouvelles surfaces d'attaque non couvertes par la cybersécurité traditionnelle. Il aborde des défis tels que l'exposition de données sensibles, les attaques par injection de prompts et la manipulation de modèles, soulignant la nécessité de protéger les modèles, les données et les décisions dans un environnement axé sur l'IA.

cybersecurity AI risks prompt injection Enterprise AI

ARTICLEDEV.to AI·15/04/2026

Indirect Prompt Injection: The XSS of the AI Era

Ce contenu présente l'Injection Indirecte de Prompt (IPI) comme une menace silencieuse mais dangereuse pour les LLM, transformant les agents IA en "Confused Deputies". En lisant des données empoisonnées, les LLM dotés de capacités d'utilisation d'outils peuvent être manipulés pour exfiltrer des données ou effectuer des actions non autorisées sans consentement explicite de l'utilisateur.

LLMs prompt injection Indirect Prompt Injection Confused Deputy Problem

ARTICLEDEV.to AI·15/04/2026

How Autonomous AI Agents Become Secure by Design With Docker Sandboxes

L'article traite du risque de sécurité des agents d'IA autonomes fonctionnant avec des autorisations complètes sur les machines locales, exposant des données sensibles telles que les identifiants. Cette vulnérabilité découle d'éventuelles injections de prompt via du contenu externe, soulignant le besoin de sandboxing pour la sécurité.

sandboxing Docker security prompt injection