RESEARCH27

When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning

arXiv CS.LG·19. Mai 2026

Diese Forschung untersucht die gegnerische Aktionsmaskierung im Self-Play Reinforcement Learning, bei der ein Angreifer selektiv legale Aktionen aus dem Aktionssatz eines Opfers entfernt. Die Studie ergab, dass erlerntes Maskieren wesentlich mehr Schaden anrichtet als zufälliges Maskieren, wodurch die Verfügbarkeit von Aktionen als kritische Robustheitsoberfläche im Self-Play RL identifiziert wird.

reinforcement learning security self-play adversarial attacks

Original lesen ↗