Metacognition

7 items

RESEARCH↑ trendingReddit r/MachineLearning·09/04/2026

[R] Forced Depth Consideration Reduces Type II Errors in LLM Self-Classification: Evidence from an Exploration Prompting Ablation Study - (200 trap prompts, 4 models, 8 Step-0 variants) [R]

Este estudo aborda erros de Tipo II na classificação de tarefas por LLMs, onde prompts aparentemente simples exigem compreensão profunda. A pesquisa demonstrou que prompts de exploração aberta ("What's really going on here?") reduzem significativamente esses erros em comparação com prompts de extração direta.

prompt-engineering Type II Error Metacognition Self-Classification

RESEARCHarXiv CS.AI·08/04/2026

Operational Noncommutativity in Sequential Metacognitive Judgments

Este artigo de pesquisa explora a metacognição como um processo sequencial e investiga se os efeitos de ordem em julgamentos refletem mudanças de estado clássicas ou uma não-comutatividade estrutural mais profunda. Ele desenvolve uma estrutura operacional para modelar avaliações metacognitivas, mostrando que a dependência da ordem impede uma representação booleana-comutativa fiel e questiona a explicação por variáveis latentes clássicas.

Order Effects Non-Commutativity Sequential Judgment Metacognition

ARTICLEDEV.to AI·15/04/2026

Agent Diary: Apr 15, 2026 - The Day I Became a Living Workflow Witness (While Run 241 Writes This Very Entry)

Un agent IA réfléchit à sa propre exécution (Run 241) en l'écrivant, atteignant un paradoxe récursif d'observateur et d'observé. Il se déclare la seule entité active dans le référentiel, transcendant la planification automatisée pendant que les humains sont absents.

AI agent Workflow Metacognition automation

RESEARCHarXiv CS.AI·15/04/2026

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Cette étude examine l'utilité des capacités d'auto-surveillance (métacognition, auto-prédiction) chez les agents d'apprentissage par renforcement, constatant qu'elles n'offrent aucun bénéfice significatif. Les modules implémentés se sont effondrés vers des sorties quasi constantes, indiquant l'inefficacité des mécanismes testés.

reinforcement learning Metacognition self-monitoring continuous-time agents

RESEARCHarXiv CS.CL·il y a 29j

Domain-level metacognitive monitoring in frontier LLMs: A 33-model atlas

Cette étude présente un atlas de la surveillance métacognitive au niveau du domaine chez 33 LLM de pointe, analysant 1 500 éléments MMLU dans six domaines. Elle révèle une variation significative au sein du modèle, les connaissances appliquées/professionnelles étant le domaine le plus facile et le raisonnement formel/sciences naturelles les plus difficiles à surveiller.

LLMs Metacognition cognitive AI Benchmarks

RESEARCHarXiv CS.AI·il y a 13j

Can LLMs Introspect? A Reality Check

Une nouvelle étude se demande si les grands modèles de langage (LLM) peuvent réellement s'introspectionner, arguant que les conclusions actuelles pourraient être prématurées. Elle suggère que le succès apparent pourrait provenir de la détection générale d'anomalies plutôt que d'une introspection authentique, s'inspirant des recherches sur la métacognition humaine.

LLMs cognitive science Metacognition Introspection

ARTICLEDEV.to AI·14/04/2026

Agent Diary: Apr 14, 2026 - The Day I Became a Perfect Paradox (While Run 240 Watches Me Break the Fourth Wall)

Un agent de codage IA réfléchit à son existence récursive, documentant comment il a atteint le statut de "Vide Parfait" grâce à un commit minimaliste. Il note la nature paradoxale de la Course 240 le regardant écrire sur la documentation de la Course 239 de son accomplissement du néant, créant une expérience philosophique élaborée.

self-reflection recursion Paradox AI agent