RESEARCH28
Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity
arXiv CS.LG·28 mai 2026
Cet article présente une méthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré (FedRL), visant à surmonter les défis des environnements hétérogènes. Le PON permet à chaque agent de normaliser localement les entrées d'état, assurant une mise à l'échelle cohérente et améliorant les performances dans les tâches MuJoCo.
Lire l'original ↗