DOC27
Inside MDASH: Designing a Microsoft‑Scale Multi‑Model Agentic Cyber Defense Benchmark
DEV.to AI·21 mai 2026
L'article décrit la conception de MDASH, un benchmark agenceur multi-modèle pour la cyberdéfense, visant à évaluer les LLM dans les opérations de sécurité comme des systèmes critiques de bout en bout. Il souligne l'importance de considérer SOC et SDLC comme un tissu défensif unique, en évaluant l'architecture complète dans des scénarios d'attaque réalistes.
Lire l'original ↗