heapsort
RESEARCH28

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

arXiv CS.LG·28 mai 2026

Cet article présente une méthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré (FedRL), visant à surmonter les défis des environnements hétérogènes. Le PON permet à chaque agent de normaliser localement les entrées d'état, assurant une mise à l'échelle cohérente et améliorant les performances dans les tâches MuJoCo.

Lire l'original