← heapsort-ai

AI defense

3 items

RESEARCHarXiv CS.CL·8/5/2026

One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue

Esta investigación aborda la creciente amenaza de intenciones maliciosas ocultas en diálogos multiturno con grandes modelos de lenguaje (LLM), donde los atacantes distribuyen su objetivo dañino a lo largo de múltiples interacciones. Propone un mecanismo de detección temprana para identificar el turno en el que una respuesta podría habilitar una acción perjudicial, introduciendo también el Multi-Turn Intent Dataset (MTID) para entrenamiento y evaluación.

27
ARTICLEDEV.to AI·12/4/2026

MCP Scanner Comparison: Cisco vs Snyk vs Pipelock

Este artículo compara tres escáneres de seguridad (Cisco mcp-scanner, Snyk agent-scan y Pipelock) para la pila de agentes MCP, detallando sus funcionalidades y diferencias. Analiza cómo estas herramientas protegen los modelos de IA contra ataques, como descripciones de herramientas maliciosas o respuestas envenenadas, tanto antes de la implementación como en tiempo real.

27