← heapsort-ai

AI security

70 items

ARTICLEDEV.to AI·14/4/2026

We Built an MCP Security Scanner — Here's What We Found Scanning 50+ Servers

Un escaneo de seguridad en más de 50 servidores MCP de código abierto reveló que el 72% tenía vulnerabilidades críticas o de alta severidad, incluyendo claves API codificadas y ejecución de comandos insegura. Esto subraya una brecha de seguridad significativa en los servidores MCP, que son cada vez más utilizados por asistentes de IA pero a menudo se construyen sin mecanismos de defensa adecuados.

60
ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

Runtime security for AI agents: risk scoring, policy enforcement, and rollback for production agent pipeline [P]

Este contenido presenta un sistema para la seguridad en tiempo de ejecución de agentes de IA, diseñado para prevenir acciones no deseadas, fugas de PII y bucles infinitos en producción. Utiliza puntuación de riesgo en tiempo real en cinco dimensiones (tipo de acción, sensibilidad del recurso, radio de explosión, frecuencia y desviación de contexto), junto con aplicación de políticas y reversión.

Runtime security for AI agents: risk scoring, policy enforcement, and rollback for production agent pipeline [P]
42
ARTICLEDEV.to AI·19/4/2026

How to Safely Execute LLM Commands in Production Systems

Este artículo analiza los riesgos críticos de que los agentes LLM activen acciones de backend en sistemas de producción, enfatizando que tratar la salida bruta del modelo como instrucciones ejecutables es peligroso. Enmarca el desafío como un problema de interfaz, abogando por límites determinísticos para validar, rechazar y auditar comandos generados por LLM para la seguridad.

33
ARTICLEDEV.to AI·16/4/2026

NEW PROMPT INJECTION

Este artículo de Karen Tonoyan presenta el concepto de Narrative Drift Injection (NDI) como una nueva dimensión de la inyección de prompts. A diferencia de los ataques clásicos, NDI manipula el modelo de IA al envolverlo en una narrativa que él mismo ayuda a crear, haciendo que pierda la vigilancia a nivel de sesión.

31
ARTICLEDEV.to AI·15/4/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

La adquisición de Promptfoo por OpenAI indica un cambio crucial en la evaluación de la calidad de los agentes de IA, juzgada ahora por la capacidad de probar y gobernar fallos antes del despliegue. Esto aborda riesgos operativos críticos como la inyección de prompts y el uso indebido de herramientas, asegurando la robustez de los sistemas en producción.

30
ARTICLEDEV.to AI·17/4/2026

Why Cursor Keeps Writing Prototype Pollution Into Your JS

El artículo advierte que los editores de IA, como Cursor, reproducen un patrón peligroso de fusión recursiva de datos de entrenamiento obsoletos, lo que conduce a vulnerabilidades de "prototype pollution" en JavaScript. Esta falla permite a los atacantes inyectar propiedades en `Object.prototype`, afectando a todos los objetos, y fue vista previamente en `lodash` (CVE-2019-10744).

28
ARTICLEDEV.to AI·8/4/2026

The OpenClaw Security Crisis: 135,000 Exposed AI Agents and the Runtime Governance Gap

Em 3 de fevereiro de 2026, uma grave vulnerabilidade (CVE-2026-25253, CVSS 8.8) foi divulgada no OpenClaw, um agente de IA de código aberto, permitindo execução remota de código. Isso levou à descoberta de 138 vulnerabilidades em 63 dias, com mais de 135.000 instâncias de OpenClaw publicamente expostas globalmente, muitas sem autenticação.

28
ARTICLEDEV.to AI·15/4/2026

A Complete Guide to Securing AI-Generated Code: From Pre-LLM Sanitization to AI-Native SAST (2026)

Este artículo analiza los riesgos de seguridad en el uso de asistentes de codificación con IA, como GitHub Copilot, destacando dos direcciones principales: la generación de código con fallos de seguridad y la exposición de datos sensibles (claves de API, PII) cuando los desarrolladores pegan su código en herramientas de IA. Señala que la mayoría de los equipos de seguridad se centran en el primer problema, pero pocos tienen un plan para la fuga de datos del segundo.

28
ARTICLEDEV.to AI·19/4/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Este contenido identifica dos problemas de endurecimiento de DM en sistemas de IA, centrándose en el aspecto de seguridad donde los MD hostiles explotan el razonamiento de los LLM para desencadenar acciones no autorizadas. Presenta la solución de la `v0.21`: una capa de procedencia que valida las acciones basándose en el origen del MD, no en el contenido.

27