heapsort
RESEARCH27

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

arXiv CS.AI·15. April 2026

Diese Forschung untersucht den Nutzen von Selbstüberwachungsfähigkeiten (Metakognition, Selbstprädiktion) bei Reinforcement-Learning-Agenten und kommt zu dem Ergebnis, dass diese keinen signifikanten Vorteil bieten. Die implementierten Module lieferten nahezu konstante Ausgaben, was die Ineffektivität der getesteten Mechanismen verdeutlicht.

Original lesen