RESEARCH27
When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning
arXiv CS.LG·19 de mayo de 2026
Esta investigación estudia el enmascaramiento de acciones adversario en el aprendizaje por refuerzo de auto-juego, donde un atacante elimina selectivamente acciones legales del conjunto de acciones de una víctima. El estudio encontró que el enmascaramiento aprendido causa un daño sustancialmente mayor que el enmascaramiento aleatorio, identificando la disponibilidad de acciones como una superficie de robustez distinta en el RL de auto-juego.
Leer original ↗