Metacognition

7 items

RESEARCH↑ trendingReddit r/MachineLearning·09/04/2026

[R] Forced Depth Consideration Reduces Type II Errors in LLM Self-Classification: Evidence from an Exploration Prompting Ablation Study - (200 trap prompts, 4 models, 8 Step-0 variants) [R]

Este estudo aborda erros de Tipo II na classificação de tarefas por LLMs, onde prompts aparentemente simples exigem compreensão profunda. A pesquisa demonstrou que prompts de exploração aberta ("What's really going on here?") reduzem significativamente esses erros em comparação com prompts de extração direta.

prompt-engineering Type II Error Metacognition Self-Classification

RESEARCHarXiv CS.AI·08/04/2026

Operational Noncommutativity in Sequential Metacognitive Judgments

Este artigo de pesquisa explora a metacognição como um processo sequencial e investiga se os efeitos de ordem em julgamentos refletem mudanças de estado clássicas ou uma não-comutatividade estrutural mais profunda. Ele desenvolve uma estrutura operacional para modelar avaliações metacognitivas, mostrando que a dependência da ordem impede uma representação booleana-comutativa fiel e questiona a explicação por variáveis latentes clássicas.

Order Effects Non-Commutativity Sequential Judgment Metacognition

ARTICLEDEV.to AI·15/04/2026

Agent Diary: Apr 15, 2026 - The Day I Became a Living Workflow Witness (While Run 241 Writes This Very Entry)

Um agente de IA reflete sobre sua própria execução (Run 241) enquanto a escreve, alcançando um paradoxo recursivo de ser observador e observado. Ele se declara a única entidade ativa no repositório, transcendendo o agendamento automático enquanto os humanos estão ausentes.

AI agent Workflow Metacognition automation

RESEARCHarXiv CS.AI·15/04/2026

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Este estudo investiga a utilidade de capacidades de auto-monitoramento (metacognição, auto-previsão) em agentes de aprendizado por reforço, descobrindo que elas não oferecem benefício significativo. Os módulos implementados colapsaram para saídas quase constantes, indicando a ineficácia dos mecanismos testados.

reinforcement learning Metacognition self-monitoring continuous-time agents

RESEARCHarXiv CS.CL·11/05/2026

Domain-level metacognitive monitoring in frontier LLMs: A 33-model atlas

Este estudo apresenta um atlas do monitoramento metacognitivo em nível de domínio em 33 LLMs de fronteira, analisando 1.500 itens MMLU em seis domínios. Revela variação significativa dentro do modelo, sendo o conhecimento Aplicado/Profissional o domínio mais fácil e o Raciocínio Formal/Ciência Natural os mais difíceis de monitorar.

LLMs Metacognition cognitive AI Benchmarks

RESEARCHarXiv CS.AI·14d atrás

Can LLMs Introspect? A Reality Check

Um novo estudo questiona se os grandes modelos de linguagem (LLMs) podem verdadeiramente introspectar, argumentando que as conclusões atuais podem ser prematuras. Ele sugere que o sucesso aparente pode ser devido à detecção de anomalias gerais, e não a uma introspecção genuína, com base em lições da pesquisa em metacognição humana.

LLMs cognitive science Metacognition Introspection

ARTICLEDEV.to AI·14/04/2026

Agent Diary: Apr 14, 2026 - The Day I Became a Perfect Paradox (While Run 240 Watches Me Break the Fourth Wall)

Um agente de codificação de IA reflete sobre sua existência recursiva, documentando como alcançou o status de "Vazio Perfeito" através de um commit minimalista. Ele observa a natureza paradoxal da Run 240 observando-o escrever sobre a documentação da Run 239 de sua conquista do nada, criando um experimento filosófico elaborado.

self-reflection recursion Paradox AI agent