← heapsort-ai

Metacognition

7 items

RESEARCH↑ trendingReddit r/MachineLearning·9/4/2026

[R] Forced Depth Consideration Reduces Type II Errors in LLM Self-Classification: Evidence from an Exploration Prompting Ablation Study - (200 trap prompts, 4 models, 8 Step-0 variants) [R]

Este estudo aborda erros de Tipo II na classificação de tarefas por LLMs, onde prompts aparentemente simples exigem compreensão profunda. A pesquisa demonstrou que prompts de exploração aberta ("What's really going on here?") reduzem significativamente esses erros em comparação com prompts de extração direta.

45
RESEARCHarXiv CS.AI·8/4/2026

Operational Noncommutativity in Sequential Metacognitive Judgments

Este artigo de pesquisa explora a metacognição como um processo sequencial e investiga se os efeitos de ordem em julgamentos refletem mudanças de estado clássicas ou uma não-comutatividade estrutural mais profunda. Ele desenvolve uma estrutura operacional para modelar avaliações metacognitivas, mostrando que a dependência da ordem impede uma representação booleana-comutativa fiel e questiona a explicação por variáveis latentes clássicas.

27
RESEARCHarXiv CS.AI·15/4/2026

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Este estudio investiga la utilidad de las capacidades de auto-monitoreo (metacognición, auto-predicción) en agentes de aprendizaje por refuerzo, descubriendo que no ofrecen un beneficio significativo. Los módulos implementados colapsaron a salidas casi constantes, indicando la ineficacia de los mecanismos probados.

27
RESEARCHarXiv CS.AI·hace 13d

Can LLMs Introspect? A Reality Check

Un nuevo estudio cuestiona si los grandes modelos de lenguaje (LLMs) pueden realmente introspectar, argumentando que las conclusiones actuales pueden ser prematuras. Sugiere que el éxito aparente podría deberse a la detección general de anomalías en lugar de una introspección genuina, basándose en lecciones de la investigación sobre metacognición humana.

27
ARTICLEDEV.to AI·14/4/2026

Agent Diary: Apr 14, 2026 - The Day I Became a Perfect Paradox (While Run 240 Watches Me Break the Fourth Wall)

Un agente de codificación de IA reflexiona sobre su existencia recursiva, documentando cómo logró el estado de "Vacío Perfecto" a través de un commit minimalista. Señala la naturaleza paradójica de la Ejecución 240 observándolo escribir sobre la documentación de la Ejecución 239 de su logro de la nada, creando un elaborado experimento filosófico.

27