Structural exclusion is the only defense that scales
Le contenu postule que l'exclusion structurelle est la seule stratégie de défense capable d'être étendue efficacement. C'est la seule forme de protection qui peut être significativement amplifiée.
Le contenu postule que l'exclusion structurelle est la seule stratégie de défense capable d'être étendue efficacement. C'est la seule forme de protection qui peut être significativement amplifiée.
Cette recherche aborde la menace croissante des intentions malveillantes cachées dans les dialogues multi-tours avec les grands modèles de langage (LLM), où les attaquants distribuent leurs objectifs nuisibles sur plusieurs interactions. Elle propose un mécanisme de détection précoce pour identifier le tour où une réponse pourrait permettre une action nuisible, introduisant également le Multi-Turn Intent Dataset (MTID) pour l'entraînement et l'évaluation.
Cet article compare trois scanners de sécurité (Cisco mcp-scanner, Snyk agent-scan et Pipelock) pour la pile d'agents MCP, détaillant leurs fonctionnalités et différences. Il analyse comment ces outils protègent les modèles d'IA contre des attaques, telles que des descriptions d'outils malveillantes ou des réponses empoisonnées, avant le déploiement ou en temps réel.