heapsort
RESEARCH27

When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning

arXiv CS.LG·19 mai 2026

Cette recherche étudie le masquage d'actions adversaire dans l'apprentissage par renforcement en auto-apprentissage, où un attaquant supprime sélectivement des actions légales de l'ensemble d'actions d'une victime. L'étude a révélé que le masquage appris cause des dommages considérablement plus importants que le masquage aléatoire, identifiant la disponibilité des actions comme une surface de robustesse distincte dans le RL en auto-apprentissage.

Lire l'original