heapsort
RESEARCH27

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

arXiv CS.AI·15 de abril de 2026

Este estudo investiga a utilidade de capacidades de auto-monitoramento (metacognição, auto-previsão) em agentes de aprendizado por reforço, descobrindo que elas não oferecem benefício significativo. Os módulos implementados colapsaram para saídas quase constantes, indicando a ineficácia dos mecanismos testados.

Ler original