RESEARCH27

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

arXiv CS.AI·15 de abril de 2026

Este estudo investiga a utilidade de capacidades de auto-monitoramento (metacognição, auto-previsão) em agentes de aprendizado por reforço, descobrindo que elas não oferecem benefício significativo. Os módulos implementados colapsaram para saídas quase constantes, indicando a ineficácia dos mecanismos testados.

reinforcement learning Metacognition self-monitoring continuous-time agents multi-timescale agents

Ler original ↗