RESEARCH28
A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning
arXiv CS.LG·19 mai 2026
Cet article montre qu'un seuil dans la capacité de décision régit l'effondrement des agents d'apprentissage par renforcement en auto-apprentissage sous des perturbations asymétriques. L'élimination de toutes les décisions contingentes à portée positive entraîne un effondrement rapide, tandis que la conservation d'une seule de ces décisions empêche cet effondrement.
Lire l'original ↗