RESEARCH27
Confidence Estimation in Automatic Short Answer Grading with LLMs
arXiv CS.CL·4. Mai 2026
Diese Arbeit untersucht die Vertrauensschätzung bei der automatischen Bewertung kurzer Antworten (ASAG) mit großen Sprachmodellen (LLMs), was für die Mensch-KI-Zusammenarbeit in der Bildung unerlässlich ist. Sie vergleicht modellbasierte Vertrauensschätzungsstrategien und schlägt ein hybrides Framework vor, um deren Einschränkungen zu beheben.
Original lesen ↗