heapsort
RESEARCH28

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

arXiv CS.LG·28. Mai 2026

Dieses Papier stellt eine personalisierte Beobachtungsnormalisierungsmethode (PON) für föderiertes Reinforcement Learning (FedRL) vor, um Herausforderungen in heterogenen Umgebungen zu bewältigen. PON ermöglicht es jedem Agenten, lokale Zustandseingaben zu normalisieren, wodurch eine konsistente Skalierung gewährleistet und die Leistung bei heterogenen MuJoCo-Aufgaben verbessert wird.

Original lesen