← heapsort-ai

LLM security

10 items

ARTICLEDEV.to AI·19/4/2026

Two DM-origin problems, not one: security hardening vs. compliance-bias hardening

Este contenido identifica dos problemas de endurecimiento de DM en sistemas de IA, centrándose en el aspecto de seguridad donde los MD hostiles explotan el razonamiento de los LLM para desencadenar acciones no autorizadas. Presenta la solución de la `v0.21`: una capa de procedencia que valida las acciones basándose en el origen del MD, no en el contenido.

27
ARTICLEDEV.to AI·15/4/2026

How to Prevent Prompt Injection: Why Pre-LLM Sanitization Matters

La inyección de prompt es una vulnerabilidad de seguridad donde la entrada no confiable es interpretada como instrucciones por un LLM, permitiendo a los atacantes anular el comportamiento del sistema. La prevención eficaz exige la sanitización pre-LLM de la entrada del usuario mediante validación y filtrado, preferiblemente con análisis estático a nivel de código.

27
ARTICLEDEV.to AI·hace 15d

Anthropic Claude Breach? Engineering Lessons from a Hypothetical 16M‑Conversation Leak

Este artículo explora las lecciones de ingeniería de una hipotética filtración de 16 millones de conversaciones de Claude de Anthropic, destacando los LLM como una superficie de ataque distinta. Subraya que los límites de las amenazas ahora incluyen entornos de terceros y registros ricos, expandiendo una filtración de chat a una filtración empresarial.

27
ARTICLEDEV.to AI·20/4/2026

MCP Security in 2026: How to Protect Your AI Agents from Prompt Injection

Este artículo explora el riesgo de inyección de prompt indirecta en agentes de IA, como Claude Desktop, que utilizan herramientas externas a través del Protocolo de Contexto del Modelo (MCP). Detalla cómo las salidas de las herramientas pueden convertirse en vectores de ataque y ofrece soluciones de código para implementar el escaneo de inyección.

27