← heapsort-ai

AI defense

3 items

RESEARCHarXiv CS.CL·5/8/2026

One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue

Diese Forschung befasst sich mit der wachsenden Bedrohung durch versteckte bösartige Absichten in mehrstufigen Dialogen mit großen Sprachmodellen (LLMs), bei denen Angreifer ihre schädlichen Ziele über mehrere Interaktionen verteilen. Sie schlägt einen Frühwarnmechanismus vor, um den Zeitpunkt zu identifizieren, an dem eine Antwort schädliche Aktionen ermöglichen könnte, und führt auch den Multi-Turn Intent Dataset (MTID) für Training und Evaluierung ein.

27
ARTICLEDEV.to AI·4/12/2026

MCP Scanner Comparison: Cisco vs Snyk vs Pipelock

Dieser Artikel vergleicht drei Sicherheitsscanner (Cisco mcp-scanner, Snyk agent-scan und Pipelock) für den MCP-Agenten-Stack und beschreibt deren Funktionalitäten und Unterschiede. Er analysiert, wie diese Tools KI-Modelle vor Angriffen wie bösartigen Tool-Beschreibungen oder vergifteten Antworten schützen, sowohl vor der Bereitstellung als auch in Echtzeit.

27