RESEARCHarXiv CS.LG·hace 12d
Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity
El artículo presenta un método de normalización de observación personalizada (PON) para el aprendizaje por refuerzo federado (FedRL), diseñado para superar desafíos en entornos heterogéneos. Este método permite que cada agente normalice localmente las entradas de estado, asegurando un escalado consistente y mejorando el rendimiento en tareas MuJoCo.
28