heapsort
RESEARCH27

Confidence Estimation in Automatic Short Answer Grading with LLMs

arXiv CS.CL·4 mai 2026

Ce travail étudie l'estimation de la confiance dans la notation automatique des réponses courtes (ASAG) avec les grands modèles linguistiques (LLM), essentielle pour la collaboration homme-IA en éducation. Il compare les stratégies d'estimation de la confiance basées sur le modèle et propose un cadre hybride pour surmonter leurs limites.

Lire l'original