AI security

70 items

ARTICLEDEV.to AI·14/4/2026

We Built an MCP Security Scanner — Here's What We Found Scanning 50+ Servers

Un escaneo de seguridad en más de 50 servidores MCP de código abierto reveló que el 72% tenía vulnerabilidades críticas o de alta severidad, incluyendo claves API codificadas y ejecución de comandos insegura. Esto subraya una brecha de seguridad significativa en los servidores MCP, que son cada vez más utilizados por asistentes de IA pero a menudo se construyen sin mecanismos de defensa adecuados.

Hardcoded Secrets MCP vulnerability scanning Input Validation

ARTICLEDEV.to AI·14/4/2026

State of OpenClaw Security 2026: 7 Risks Defining Safe...

Este contenido analiza el estado de la seguridad de OpenClaw en 2026, identificando fallas de higiene de implementación y la inyección de prompts como los principales riesgos. Sugiere la reducción del radio de impacto para la inyección de prompts y enfatiza la importancia de auditorías y el endurecimiento de configuraciones.

OpenClaw cybersecurity ML Security prompt injection

NEWS↑ trendingHacker News (AI)·hace 4d

ZEC drops 30% after Anthropic AI finds Zcash counterfeit vulnerability

ZEC cayó un 30% después de que la IA de Anthropic descubriera una vulnerabilidad de falsificación en Zcash. Este hallazgo afectó significativamente el valor de la criptomoneda.

Blockchain cryptocurrency vulnerability security

ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

Runtime security for AI agents: risk scoring, policy enforcement, and rollback for production agent pipeline [P]

Este contenido presenta un sistema para la seguridad en tiempo de ejecución de agentes de IA, diseñado para prevenir acciones no deseadas, fugas de PII y bucles infinitos en producción. Utiliza puntuación de riesgo en tiempo real en cinco dimensiones (tipo de acción, sensibilidad del recurso, radio de explosión, frecuencia y desviación de contexto), junto con aplicación de políticas y reversión.

risk management AI security AI agents

Runtime security for AI agents: risk scoring, policy enforcement, and rollback for production agent pipeline [P]

NEWS↑ trendingReddit r/LocalLLaMA·9/4/2026

Local (small) LLMs found the same vulnerabilities as Mythos

Pequenos Modelos de Linguagem Grandes (LLMs) descobriram as mesmas vulnerabilidades que o sistema Mythos. Este achado sugere que modelos menores podem replicar descobertas críticas de segurança em sistemas de IA.

LLMs Mythos vulnerabilities AI security

NEWSDEV.to AI·19/4/2026

Trend Micro Launches TrendAI Governance Gateway for OpenClaw Agents

Trend Micro lanzó el TrendAI Governance Gateway en RSAC 2026, una plataforma para la visibilidad y el control de las operaciones de agentes de IA autónomos. La solución incluye monitoreo en tiempo real, análisis de intención, aplicación de políticas, supervisión humana y simulación previa a la implementación.

autonomous agents AI security AI Governance

ARTICLEDEV.to AI·19/4/2026

How to Safely Execute LLM Commands in Production Systems

Este artículo analiza los riesgos críticos de que los agentes LLM activen acciones de backend en sistemas de producción, enfatizando que tratar la salida bruta del modelo como instrucciones ejecutables es peligroso. Enmarca el desafío como un problema de interfaz, abogando por límites determinísticos para validar, rechazar y auditar comandos generados por LLM para la seguridad.

LLM Agents production systems AI safety AI security

ARTICLEDEV.to AI·16/4/2026

NEW PROMPT INJECTION

Este artículo de Karen Tonoyan presenta el concepto de Narrative Drift Injection (NDI) como una nueva dimensión de la inyección de prompts. A diferencia de los ataques clásicos, NDI manipula el modelo de IA al envolverlo en una narrativa que él mismo ayuda a crear, haciendo que pierda la vigilancia a nivel de sesión.

vulnerability prompt injection AI security

ARTICLEDEV.to AI·15/4/2026

3 Prototype Pollution Bugs Cursor Keeps Writing Into Your Code

Los editores de IA como Cursor generan patrones vulnerables de fusión profunda y propagación de objetos, lo que provoca errores de contaminación de prototipos. Los atacantes pueden explotar estas fallas inyectando propiedades `proto` para sobrescribir los valores predeterminados de los objetos y eludir la autenticación.

Software Security JavaScript Prototype Pollution AI code generation

ARTICLEDEV.to AI·15/4/2026

OpenAI's Promptfoo deal puts evaluation and red-teaming at the centre of the agent stack

La adquisición de Promptfoo por OpenAI indica un cambio crucial en la evaluación de la calidad de los agentes de IA, juzgada ahora por la capacidad de probar y gobernar fallos antes del despliegue. Esto aborda riesgos operativos críticos como la inyección de prompts y el uso indebido de herramientas, asegurando la robustez de los sistemas en producción.

red-teaming LLM Agents evaluation prompt injection

ARTICLEDEV.to AI·11/4/2026

Cryptographic Proof of Agent-to-Agent Handoffs in Python

La versión 0.6.1 de la biblioteca `air-trust` introduce pruebas criptográficas (firmas Ed25519) para transferencias de datos entre agentes en sistemas de IA multiagente en Python. Esto resuelve problemas de auditoría y seguridad, garantizando la autenticidad de los datos y la responsabilidad de cada agente en los pipelines de IA.

multi-agent AI audit trail Python Cryptographic Proof

ARTICLEDEV.to AI·18/4/2026

Zero Token Architecture: Why Your AI Agent Should Never See Your Real API Key

Este artículo critica la seguridad convencional de los agentes de IA por pasar por alto el riesgo de exponer claves de API en texto plano. Propone una "Arquitectura de Token Cero" donde los agentes reciben un token falso, y la clave real se intercambia en el límite del sistema para evitar filtraciones por inyección de prompt.

API security prompt injection AI security AI agents

ARTICLEDEV.to AI·12/4/2026

Six bugs that only appeared after real users installed my React security library

El autor desarrolló la biblioteca React FieldShield para proteger entradas sensibles de grabadores de sesión y lectores de pantalla de IA, aislando valores en un Web Worker. El artículo detalla seis errores que solo surgieron tras la instalación por usuarios reales, evidenciando desafíos en la seguridad de datos.

web development bugs privacy ReAct

ARTICLEDEV.to AI·17/4/2026

Why Cursor Keeps Writing Prototype Pollution Into Your JS

El artículo advierte que los editores de IA, como Cursor, reproducen un patrón peligroso de fusión recursiva de datos de entrenamiento obsoletos, lo que conduce a vulnerabilidades de "prototype pollution" en JavaScript. Esta falla permite a los atacantes inyectar propiedades en `Object.prototype`, afectando a todos los objetos, y fue vista previamente en `lodash` (CVE-2019-10744).

AI models Software Development vulnerability JavaScript

ARTICLEDEV.to AI·8/4/2026

The OpenClaw Security Crisis: 135,000 Exposed AI Agents and the Runtime Governance Gap

Em 3 de fevereiro de 2026, uma grave vulnerabilidade (CVE-2026-25253, CVSS 8.8) foi divulgada no OpenClaw, um agente de IA de código aberto, permitindo execução remota de código. Isso levou à descoberta de 138 vulnerabilidades em 63 dias, com mais de 135.000 instâncias de OpenClaw publicamente expostas globalmente, muitas sem autenticação.

vulnerability cybersecurity open-source AI AI security

ARTICLEDEV.to AI·17/4/2026

The Prompt-Injection Bug That Took Down My Agent for 6 Hours

El autor describe una interrupción de 6 horas en su agente de contenido de IA, causada por un error de inyección de prompt indirecta proveniente de un archivo de investigación no validado. Esto llevó al agente a generar 47 borradores idénticos e incompletos, subrayando la necesidad crítica de validación de entrada en sistemas de IA.

LLM vulnerabilities prompt injection AI security AI agents

ARTICLEDEV.to AI·15/4/2026

A Complete Guide to Securing AI-Generated Code: From Pre-LLM Sanitization to AI-Native SAST (2026)

Este artículo analiza los riesgos de seguridad en el uso de asistentes de codificación con IA, como GitHub Copilot, destacando dos direcciones principales: la generación de código con fallos de seguridad y la exposición de datos sensibles (claves de API, PII) cuando los desarrolladores pegan su código en herramientas de IA. Señala que la mayoría de los equipos de seguridad se centran en el primer problema, pero pocos tienen un plan para la fuga de datos del segundo.

data leakage code security Software Development Security AI coding assistants

ARTICLEDEV.to AI·16/4/2026

Securing AI Agents: A Practical Guide for IT Leaders

Este artículo ofrece una guía práctica para líderes de TI sobre cómo asegurar agentes de IA, abordando requisitos operativos inmediatos. Destaca los desafíos únicos de la seguridad de agentes de IA en comparación con las aplicaciones tradicionales debido a su comportamiento impredecible.

cybersecurity AI security AI agents

ARTICLEDEV.to AI·19/4/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Este contenido identifica dos problemas de endurecimiento de DM en sistemas de IA, centrándose en el aspecto de seguridad donde los MD hostiles explotan el razonamiento de los LLM para desencadenar acciones no autorizadas. Presenta la solución de la `v0.21`: una capa de procedencia que valida las acciones basándose en el origen del MD, no en el contenido.

vulnerability system hardening LLM security direct messages

ARTICLEDEV.to AI·19/4/2026

Your WAF thinks in ATT&CK. Your LLM app needs ATLAS. Here's the bridge.

Las taxonomías tradicionales de seguridad de aplicaciones web como MITRE ATT&CK no cubren nuevas amenazas específicas de los LLM, como la inyección de prompt o los jailbreaks. MITRE ATLAS fue desarrollado para cerrar esta brecha, ofreciendo un marco estandarizado para las amenazas en sistemas de IA/ML.

MITRE ATLAS threat intelligence LLM security prompt injection