RESEARCH27
ARMOR 2025: A Military-Aligned Benchmark for Evaluating Large Language Model Safety Beyond Civilian Contexts
arXiv CS.AI·4 de mayo de 2026
ARMOR 2025 es un nuevo benchmark alineado militarmente para evaluar la seguridad de los grandes modelos de lenguaje (LLMs) en aplicaciones de defensa. Se enfoca en doctrinas militares como el Derecho de la Guerra y las Reglas de Enfrentamiento para asegurar el cumplimiento legal y ético.
Leer original ↗