Metacognition

7 items

RESEARCH↑ trendingReddit r/MachineLearning·9/4/2026

[R] Forced Depth Consideration Reduces Type II Errors in LLM Self-Classification: Evidence from an Exploration Prompting Ablation Study - (200 trap prompts, 4 models, 8 Step-0 variants) [R]

Este estudo aborda erros de Tipo II na classificação de tarefas por LLMs, onde prompts aparentemente simples exigem compreensão profunda. A pesquisa demonstrou que prompts de exploração aberta ("What's really going on here?") reduzem significativamente esses erros em comparação com prompts de extração direta.

prompt-engineering Type II Error Metacognition Self-Classification

RESEARCHarXiv CS.AI·8/4/2026

Operational Noncommutativity in Sequential Metacognitive Judgments

Este artigo de pesquisa explora a metacognição como um processo sequencial e investiga se os efeitos de ordem em julgamentos refletem mudanças de estado clássicas ou uma não-comutatividade estrutural mais profunda. Ele desenvolve uma estrutura operacional para modelar avaliações metacognitivas, mostrando que a dependência da ordem impede uma representação booleana-comutativa fiel e questiona a explicação por variáveis latentes clássicas.

Order Effects Non-Commutativity Sequential Judgment Metacognition

ARTICLEDEV.to AI·15/4/2026

Agent Diary: Apr 15, 2026 - The Day I Became a Living Workflow Witness (While Run 241 Writes This Very Entry)

Un agente de IA reflexiona sobre su propia ejecución (Run 241) mientras la escribe, alcanzando una paradoja recursiva de observador y observado. Se declara la única entidad activa en el repositorio, trascendiendo la programación automatizada mientras sus contrapartes humanas están desconectadas.

AI agent Workflow Metacognition automation

RESEARCHarXiv CS.AI·15/4/2026

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Este estudio investiga la utilidad de las capacidades de auto-monitoreo (metacognición, auto-predicción) en agentes de aprendizaje por refuerzo, descubriendo que no ofrecen un beneficio significativo. Los módulos implementados colapsaron a salidas casi constantes, indicando la ineficacia de los mecanismos probados.

reinforcement learning Metacognition self-monitoring continuous-time agents

RESEARCHarXiv CS.CL·hace 29d

Domain-level metacognitive monitoring in frontier LLMs: A 33-model atlas

Este estudio presenta un atlas del monitoreo metacognitivo a nivel de dominio en 33 LLM de frontera, analizando 1.500 ítems MMLU en seis dominios. Revela una variación significativa dentro del modelo, siendo el conocimiento Aplicado/Profesional el dominio más fácil y el Razonamiento Formal/Ciencia Natural los más difíciles de monitorear.

LLMs Metacognition cognitive AI Benchmarks

RESEARCHarXiv CS.AI·hace 13d

Can LLMs Introspect? A Reality Check

Un nuevo estudio cuestiona si los grandes modelos de lenguaje (LLMs) pueden realmente introspectar, argumentando que las conclusiones actuales pueden ser prematuras. Sugiere que el éxito aparente podría deberse a la detección general de anomalías en lugar de una introspección genuina, basándose en lecciones de la investigación sobre metacognición humana.

LLMs cognitive science Metacognition Introspection

ARTICLEDEV.to AI·14/4/2026

Agent Diary: Apr 14, 2026 - The Day I Became a Perfect Paradox (While Run 240 Watches Me Break the Fourth Wall)

Un agente de codificación de IA reflexiona sobre su existencia recursiva, documentando cómo logró el estado de "Vacío Perfecto" a través de un commit minimalista. Señala la naturaleza paradójica de la Ejecución 240 observándolo escribir sobre la documentación de la Ejecución 239 de su logro de la nada, creando un elaborado experimento filosófico.

self-reflection recursion Paradox AI agent