RESEARCH27

When Should a Language Model Trust Itself? Same-Model Self-Verification as a Conditional Confidence Signal

arXiv CS.CL·6 mai 2026

Cette recherche évalue l'auto-vérification du même modèle comme signal de confiance pour la prédiction sélective, en la comparant aux bases de référence basées sur la vraisemblance. L'étude révèle des résultats dépendants de la tâche et du modèle, montrant des améliorations significatives pour certains modèles sur ARC-Challenge mais une fiabilité moindre et une dégradation occasionnelle sur TruthfulQA-MC.

language models AI Confidence Selective Prediction machine learning Self-Verification

Lire l'original ↗