RESEARCH27

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

arXiv CS.CL·6 de maio de 2026

Esta pesquisa avalia a auto-verificação do mesmo modelo como um sinal de confiança para a previsão seletiva, comparando-a com baselines baseadas em probabilidade. O estudo revela resultados dependentes da tarefa e do modelo, mostrando melhorias significativas para alguns modelos no ARC-Challenge, mas menor confiabilidade e degradação ocasional no TruthfulQA-MC.

language models AI Confidence Selective Prediction machine learning Self-Verification

Ler original ↗