heapsort
RESEARCH27

ARMOR 2025: A Military-Aligned Benchmark for Evaluating Large Language Model Safety Beyond Civilian Contexts

arXiv CS.AI·4 de mayo de 2026

ARMOR 2025 es un nuevo benchmark alineado militarmente para evaluar la seguridad de los grandes modelos de lenguaje (LLMs) en aplicaciones de defensa. Se enfoca en doctrinas militares como el Derecho de la Guerra y las Reglas de Enfrentamiento para asegurar el cumplimiento legal y ético.

Leer original