RESEARCHarXiv CS.LG·14/4/2026
Belief-State RWKV for Reinforcement Learning under Partial Observability
Este artículo propone Belief-State RWKV, una formulación más sólida de RL donde el estado recurrente se interpreta explícitamente como un estado de creencia. El método mantiene un estado compacto consciente de la incertidumbre, permitiendo que las políticas dependan tanto de la memoria como de la confianza en entornos parcialmente observados.
27