RESEARCHarXiv CS.CL·5/4/2026
Confidence Estimation in Automatic Short Answer Grading with LLMs
Diese Arbeit untersucht die Vertrauensschätzung bei der automatischen Bewertung kurzer Antworten (ASAG) mit großen Sprachmodellen (LLMs), was für die Mensch-KI-Zusammenarbeit in der Bildung unerlässlich ist. Sie vergleicht modellbasierte Vertrauensschätzungsstrategien und schlägt ein hybrides Framework vor, um deren Einschränkungen zu beheben.
27