RESEARCHarXiv CS.CL·4/5/2026
Confidence Estimation in Automatic Short Answer Grading with LLMs
Este trabajo investiga la estimación de confianza en la Calificación Automática de Respuestas Cortas (ASAG) con Grandes Modelos de Lenguaje (LLMs), esencial para la colaboración humano-IA en educación. Compara estrategias de estimación de confianza basadas en modelos y propone un marco híbrido para abordar sus limitaciones.
27