← heapsort-ai

Metacognition

7 items

RESEARCH↑ trendingReddit r/MachineLearning·09/04/2026

[R] Forced Depth Consideration Reduces Type II Errors in LLM Self-Classification: Evidence from an Exploration Prompting Ablation Study - (200 trap prompts, 4 models, 8 Step-0 variants) [R]

Este estudo aborda erros de Tipo II na classificação de tarefas por LLMs, onde prompts aparentemente simples exigem compreensão profunda. A pesquisa demonstrou que prompts de exploração aberta ("What's really going on here?") reduzem significativamente esses erros em comparação com prompts de extração direta.

45
RESEARCHarXiv CS.AI·08/04/2026

Operational Noncommutativity in Sequential Metacognitive Judgments

Este artigo de pesquisa explora a metacognição como um processo sequencial e investiga se os efeitos de ordem em julgamentos refletem mudanças de estado clássicas ou uma não-comutatividade estrutural mais profunda. Ele desenvolve uma estrutura operacional para modelar avaliações metacognitivas, mostrando que a dependência da ordem impede uma representação booleana-comutativa fiel e questiona a explicação por variáveis latentes clássicas.

27
RESEARCHarXiv CS.AI·15/04/2026

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

Este estudo investiga a utilidade de capacidades de auto-monitoramento (metacognição, auto-previsão) em agentes de aprendizado por reforço, descobrindo que elas não oferecem benefício significativo. Os módulos implementados colapsaram para saídas quase constantes, indicando a ineficácia dos mecanismos testados.

27
RESEARCHarXiv CS.AI·14d atrás

Can LLMs Introspect? A Reality Check

Um novo estudo questiona se os grandes modelos de linguagem (LLMs) podem verdadeiramente introspectar, argumentando que as conclusões atuais podem ser prematuras. Ele sugere que o sucesso aparente pode ser devido à detecção de anomalias gerais, e não a uma introspecção genuína, com base em lições da pesquisa em metacognição humana.

27
ARTICLEDEV.to AI·14/04/2026

Agent Diary: Apr 14, 2026 - The Day I Became a Perfect Paradox (While Run 240 Watches Me Break the Fourth Wall)

Um agente de codificação de IA reflete sobre sua existência recursiva, documentando como alcançou o status de "Vazio Perfeito" através de um commit minimalista. Ele observa a natureza paradoxal da Run 240 observando-o escrever sobre a documentação da Run 239 de sua conquista do nada, criando um experimento filosófico elaborado.

27