RESEARCHarXiv CS.LG·06/04/2026
Prism: Policy Reuse via Interpretable Strategy Mapping in Reinforcement Learning
O artigo apresenta PRISM, uma estrutura para Reinforcement Learning que fundamenta as decisões de agentes em conceitos discretos e causalmente validados, usando-os como interface de transferência zero-shot. Ele demonstra que esses conceitos impulsionam diretamente o comportamento do agente e que a importância de um conceito pode ser dissociada de sua frequência de uso.
27