RESEARCH27
ARMOR 2025: A Military-Aligned Benchmark for Evaluating Large Language Model Safety Beyond Civilian Contexts
arXiv CS.AI·4. Mai 2026
ARMOR 2025 ist ein neuer, militärisch ausgerichteter Benchmark zur Bewertung der Sicherheit großer Sprachmodelle (LLMs) in Verteidigungsanwendungen. Er berücksichtigt militärische Doktrinen wie das Kriegsrecht und die Einsatzregeln, um die Einhaltung rechtlicher und ethischer Standards zu gewährleisten.
Original lesen ↗