RESEARCH27
Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents
arXiv CS.AI·15 de abril de 2026
Este estudio investiga la utilidad de las capacidades de auto-monitoreo (metacognición, auto-predicción) en agentes de aprendizaje por refuerzo, descubriendo que no ofrecen un beneficio significativo. Los módulos implementados colapsaron a salidas casi constantes, indicando la ineficacia de los mecanismos probados.
Leer original ↗