RESEARCH27

When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning

arXiv CS.LG·19 de mayo de 2026

Esta investigación estudia el enmascaramiento de acciones adversario en el aprendizaje por refuerzo de auto-juego, donde un atacante elimina selectivamente acciones legales del conjunto de acciones de una víctima. El estudio encontró que el enmascaramiento aprendido causa un daño sustancialmente mayor que el enmascaramiento aleatorio, identificando la disponibilidad de acciones como una superficie de robustez distinta en el RL de auto-juego.

reinforcement learning security self-play adversarial attacks

Leer original ↗