← heapsort-ai

AI defense

3 items

RESEARCHarXiv CS.CL·08/05/2026

One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue

Cette recherche aborde la menace croissante des intentions malveillantes cachées dans les dialogues multi-tours avec les grands modèles de langage (LLM), où les attaquants distribuent leurs objectifs nuisibles sur plusieurs interactions. Elle propose un mécanisme de détection précoce pour identifier le tour où une réponse pourrait permettre une action nuisible, introduisant également le Multi-Turn Intent Dataset (MTID) pour l'entraînement et l'évaluation.

27
ARTICLEDEV.to AI·12/04/2026

MCP Scanner Comparison: Cisco vs Snyk vs Pipelock

Cet article compare trois scanners de sécurité (Cisco mcp-scanner, Snyk agent-scan et Pipelock) pour la pile d'agents MCP, détaillant leurs fonctionnalités et différences. Il analyse comment ces outils protègent les modèles d'IA contre des attaques, telles que des descriptions d'outils malveillantes ou des réponses empoisonnées, avant le déploiement ou en temps réel.

27