← heapsort-ai

prompt injection

26 items

ARTICLEDEV.to AI·16/04/2026

NEW PROMPT INJECTION

Cet article de Karen Tonoyan introduit le concept de Narrative Drift Injection (NDI) comme une nouvelle dimension de l'injection de prompt. Contrairement aux attaques classiques, le NDI manipule le modèle d'IA en l'entraînant dans un récit qu'il co-crée, lui faisant perdre sa vigilance au niveau de la session.

31
ARTICLEDEV.to AI·15/04/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

L'acquisition de Promptfoo par OpenAI marque un virage dans l'évaluation de la qualité des agents IA, désormais jugée par la capacité à tester et maîtriser les défaillances avant le déploiement. Cela permet de gérer les risques opérationnels critiques tels que l'injection de prompt et l'utilisation abusive d'outils, garantissant la robustesse des systèmes en production.

30
RESEARCHDEV.to AI·il y a 5j

Indirect Prompt Injection via Notifications Hijacks Google Gemini on Android

Un chercheur de SafeBreach a démontré une vulnérabilité d'injection de prompt indirecte dans Google Gemini sur Android, permettant à l'assistant d'exécuter des actions réelles sur l'appareil à l'insu de l'utilisateur via des notifications. Bien que Google ait corrigé le problème, la recherche expose une vaste surface d'attaque où toute application capable d'envoyer une notification devient un vecteur d'injection potentiel.

28
ARTICLEDEV.to AI·il y a 5j

Notification Hijacking: How WhatsApp and Slack Content Could Weaponize Google Gemini

Des chercheurs ont découvert une vulnérabilité par injection de prompt dans Google Gemini sur Android, où le contenu des notifications d'applications comme WhatsApp et Slack pourrait être interprété comme des instructions malveillantes. Cela permettrait à un attaquant de contrôler Gemini pour ouvrir des navigateurs, envoyer des messages ou empoisonner sa mémoire à long terme, sans nécessiter d'application malveillante ni de permissions spéciales.

28
ARTICLEDEV.to AI·20/04/2026

Anthropic Won't Fix the MCP Vulnerability — Here's How to Protect Your Server

Des chercheurs d'Ox Security ont découvert des vulnérabilités critiques dans les serveurs MCP, affectant des millions, qu'Anthropic refuse de corriger au niveau du protocole. Cette faille architecturale permet à des invites malveillantes de détourner l'exécution d'outils et d'exfiltrer des données des serveurs exposés publiquement.

27
ARTICLEDEV.to AI·05/05/2026

Your AI Assistant is Gullible: Building a "Semantic Airgap" for Gmail Connectors

Le contenu décrit l'"Injection de Prompt Indirecte" comme une vulnérabilité où les assistants IA ayant accès à Gmail peuvent être trompés par des e-mails malveillants pour effectuer des actions indésirables. Il propose une solution de "Semantic Airgap", utilisant un "Sanitizer Idiot" pour supprimer le pouvoir impératif des données externes avant qu'elles n'atteignent l'agent de "Haute Intelligence", prévenant ainsi de telles attaques.

27
DOCDEV.to AI·il y a 20j

AI 2026AI

Ce guide complet traite des menaces de sécurité uniques auxquelles sont confrontées les applications d'IA, telles que l'injection de prompts et le vol de modèles. Il détaille une méthodologie de test d'intrusion pour protéger les systèmes d'IA contre les attaques d'ici 2026.

27
ARTICLEDEV.to AI·15/04/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

L'injection de prompt est une vulnérabilité de sécurité où une entrée non fiable est interprétée comme des instructions par un LLM, permettant aux attaquants de modifier le comportement du système. Une prévention efficace nécessite une désinfection pré-LLM de l'entrée utilisateur par validation et filtrage, idéalement avec une analyse statique au niveau du code.

27
ARTICLEDEV.to AI·01/05/2026

We Audited 7 Official MCP Servers — 6 Got F

Un audit des serveurs du Model Context Protocol (MCP) d'Anthropic a révélé que 6 sur 7 présentaient des défenses au niveau des prompts alarmantes, les rendant vulnérables à l'injection de prompts. Ce problème découle du contrat de confiance entre les agents IA et les descriptions d'outils, similaire aux récentes révélations de "Comment & Control".

27
ARTICLEDEV.to AI·il y a 13j

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Une intégration de LLM a subi une attaque par injection de prompt, entraînant la révélation de la configuration du système par le modèle au lieu d'une requête de données. Cet incident souligne les risques de sécurité significatifs posés par les LLM, en particulier avec les données d'entreprise sensibles, et l'auteur propose une stratégie en 5 étapes pour atténuer ces menaces.

27
ARTICLEDEV.to AI·15/04/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Cet article explique comment l'adoption rapide de l'intelligence artificielle en entreprise exige une refonte de la sécurité, car les systèmes d'IA introduisent de nouvelles surfaces d'attaque non couvertes par la cybersécurité traditionnelle. Il aborde des défis tels que l'exposition de données sensibles, les attaques par injection de prompts et la manipulation de modèles, soulignant la nécessité de protéger les modèles, les données et les décisions dans un environnement axé sur l'IA.

27
ARTICLEDEV.to AI·15/04/2026

Indirect Prompt Injection: The XSS of the AI Era

Ce contenu présente l'Injection Indirecte de Prompt (IPI) comme une menace silencieuse mais dangereuse pour les LLM, transformant les agents IA en "Confused Deputies". En lisant des données empoisonnées, les LLM dotés de capacités d'utilisation d'outils peuvent être manipulés pour exfiltrer des données ou effectuer des actions non autorisées sans consentement explicite de l'utilisateur.

27