RESEARCH27
Confidence Estimation in Automatic Short Answer Grading with LLMs
arXiv CS.CL·4 mai 2026
Ce travail étudie l'estimation de la confiance dans la notation automatique des réponses courtes (ASAG) avec les grands modèles linguistiques (LLM), essentielle pour la collaboration homme-IA en éducation. Il compare les stratégies d'estimation de la confiance basées sur le modèle et propose un cadre hybride pour surmonter leurs limites.
Lire l'original ↗