heapsort
RESEARCH28

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

arXiv CS.LG·28 de mayo de 2026

El artículo presenta un método de normalización de observación personalizada (PON) para el aprendizaje por refuerzo federado (FedRL), diseñado para superar desafíos en entornos heterogéneos. Este método permite que cada agente normalice localmente las entradas de estado, asegurando un escalado consistente y mejorando el rendimiento en tareas MuJoCo.

Leer original