RESEARCH27
Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents
arXiv CS.AI·15 de abril de 2026
Este estudo investiga a utilidade de capacidades de auto-monitoramento (metacognição, auto-previsão) em agentes de aprendizado por reforço, descobrindo que elas não oferecem benefício significativo. Os módulos implementados colapsaram para saídas quase constantes, indicando a ineficácia dos mecanismos testados.
Ler original ↗