← heapsort-ai

prompt injection

26 items

ARTICLEDEV.to AI·16/4/2026

NEW PROMPT INJECTION

Este artículo de Karen Tonoyan presenta el concepto de Narrative Drift Injection (NDI) como una nueva dimensión de la inyección de prompts. A diferencia de los ataques clásicos, NDI manipula el modelo de IA al envolverlo en una narrativa que él mismo ayuda a crear, haciendo que pierda la vigilancia a nivel de sesión.

31
ARTICLEDEV.to AI·15/4/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

La adquisición de Promptfoo por OpenAI indica un cambio crucial en la evaluación de la calidad de los agentes de IA, juzgada ahora por la capacidad de probar y gobernar fallos antes del despliegue. Esto aborda riesgos operativos críticos como la inyección de prompts y el uso indebido de herramientas, asegurando la robustez de los sistemas en producción.

30
RESEARCHDEV.to AI·hace 5d

Indirect Prompt Injection via Notifications Hijacks Google Gemini on Android

Un investigador de SafeBreach demostró una vulnerabilidad de inyección de prompt indirecta en Google Gemini para Android, permitiendo que el asistente ejecutara acciones reales en el dispositivo sin el conocimiento del usuario a través de notificaciones. Aunque Google ha parcheado el problema, la investigación expone una gran superficie de ataque donde cualquier aplicación con capacidad de notificación puede convertirse en un vector de inyección.

28
ARTICLEDEV.to AI·hace 5d

Notification Hijacking: How WhatsApp and Slack Content Could Weaponize Google Gemini

Investigadores descubrieron una vulnerabilidad de inyección de prompt en Google Gemini para Android, donde el contenido de notificaciones de aplicaciones como WhatsApp y Slack podría ser interpretado como instrucciones maliciosas. Esto permitiría a un atacante controlar Gemini para abrir navegadores, enviar mensajes o envenenar su memoria a largo plazo, sin necesidad de una aplicación maliciosa ni permisos especiales.

28
ARTICLEDEV.to AI·5/5/2026

Your AI Assistant is Gullible: Building a "Semantic Airgap" for Gmail Connectors

El contenido describe la "Inyección de Prompt Indirecta" como una vulnerabilidad donde los asistentes de IA con acceso a Gmail pueden ser engañados por correos electrónicos maliciosos para realizar acciones no deseadas. Propone una solución de "Airgap Semántico", utilizando un "Sanitizador Tonto" para eliminar el poder imperativo de los datos externos antes de que lleguen al agente de "Alta Inteligencia", previniendo así estos ataques.

27
DOCDEV.to AI·hace 20d

AI 2026AI

Esta guía completa aborda las amenazas de seguridad únicas que enfrentan las aplicaciones de IA, como la inyección de prompts y el robo de modelos. Detalla una metodología de prueba de penetración para proteger los sistemas de IA de ataques para 2026.

27
ARTICLEDEV.to AI·15/4/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

La inyección de prompt es una vulnerabilidad de seguridad donde la entrada no confiable es interpretada como instrucciones por un LLM, permitiendo a los atacantes anular el comportamiento del sistema. La prevención eficaz exige la sanitización pre-LLM de la entrada del usuario mediante validación y filtrado, preferiblemente con análisis estático a nivel de código.

27
ARTICLEDEV.to AI·1/5/2026

We Audited 7 Official MCP Servers — 6 Got F

Una auditoría de los servidores del Model Context Protocol (MCP) de Anthropic encontró que 6 de 7 tenían defensas a nivel de prompt alarmantemente deficientes, haciéndolos vulnerables a la inyección de prompts. Este problema se deriva del contrato de confianza entre agentes de IA y descripciones de herramientas, similar a las recientes revelaciones de "Comment & Control".

27
ARTICLEDEV.to AI·hace 13d

AI Prompt Injection Defense: Building Effective Strategies in 5 Steps

Una integración de LLM experimentó un ataque de inyección de prompt, lo que provocó que el modelo revelara la configuración del sistema en lugar de una consulta de datos. Este incidente subraya los importantes riesgos de seguridad que plantean los LLM, especialmente con datos empresariales sensibles, y el autor propone una estrategia de 5 pasos para mitigar estas amenazas.

27
ARTICLEDEV.to AI·15/4/2026

Enterprise AI Security in 2026: A Practical Guide for Modern Organizations

Este artículo analiza cómo la rápida adopción de la inteligencia artificial en las empresas exige una reevaluación de la seguridad, ya que los sistemas de IA introducen nuevas superficies de ataque que la ciberseguridad tradicional no cubre. Aborda desafíos como la exposición de datos sensibles, ataques de inyección de prompts y manipulación de modelos, destacando la necesidad de proteger modelos, datos y decisiones en un entorno impulsado por la IA.

27
ARTICLEDEV.to AI·15/4/2026

Indirect Prompt Injection: The XSS of the AI Era

Este contenido presenta la Inyección Indirecta de Prompt (IPI) como una amenaza silenciosa pero peligrosa para los LLM, donde los agentes de IA se convierten en "Confused Deputies". Al leer datos envenenados, los LLM con capacidades de uso de herramientas pueden ser manipulados para exfiltrar datos o realizar acciones no autorizadas sin el consentimiento explícito del usuario.

27