heapsort
RESEARCH27

Confidence Estimation in Automatic Short Answer Grading with LLMs

arXiv CS.CL·4. Mai 2026

Diese Arbeit untersucht die Vertrauensschätzung bei der automatischen Bewertung kurzer Antworten (ASAG) mit großen Sprachmodellen (LLMs), was für die Mensch-KI-Zusammenarbeit in der Bildung unerlässlich ist. Sie vergleicht modellbasierte Vertrauensschätzungsstrategien und schlägt ein hybrides Framework vor, um deren Einschränkungen zu beheben.

Original lesen