← heapsort-ai

Belief State

1 items

RESEARCHarXiv CS.LG·14/04/2026

Belief-State RWKV for Reinforcement Learning under Partial Observability

Cet article propose Belief-State RWKV, une formulation plus robuste du RL où l'état récurrent est explicitement interprété comme un état de croyance. La méthode maintient un état compact conscient de l'incertitude, permettant aux politiques de dépendre à la fois de la mémoire et de la confiance dans des environnements partiellement observés.

27