heapsort
RESEARCH27

Domain-level metacognitive monitoring in frontier LLMs: A 33-model atlas

arXiv CS.CL·11 mai 2026

Cette étude présente un atlas de la surveillance métacognitive au niveau du domaine chez 33 LLM de pointe, analysant 1 500 éléments MMLU dans six domaines. Elle révèle une variation significative au sein du modèle, les connaissances appliquées/professionnelles étant le domaine le plus facile et le raisonnement formel/sciences naturelles les plus difficiles à surveiller.

Lire l'original