← heapsort-ai

Belief State

1 items

RESEARCHarXiv CS.LG·14/4/2026

Belief-State RWKV for Reinforcement Learning under Partial Observability

Este artículo propone Belief-State RWKV, una formulación más sólida de RL donde el estado recurrente se interpreta explícitamente como un estado de creencia. El método mantiene un estado compacto consciente de la incertidumbre, permitiendo que las políticas dependan tanto de la memoria como de la confianza en entornos parcialmente observados.

27