RESEARCH27

ARMOR 2025: A Military-Aligned Benchmark for Evaluating Large Language Model Safety Beyond Civilian Contexts

arXiv CS.AI·4. Mai 2026

ARMOR 2025 ist ein neuer, militärisch ausgerichteter Benchmark zur Bewertung der Sicherheit großer Sprachmodelle (LLMs) in Verteidigungsanwendungen. Er berücksichtigt militärische Doktrinen wie das Kriegsrecht und die Einsatzregeln, um die Einhaltung rechtlicher und ethischer Standards zu gewährleisten.

ethics military AI Benchmarks AI safety LLM

Original lesen ↗