RESEARCH27
A Semantic-Sampling Framework for Evaluating Calibration in Open-Ended Question Answering
arXiv CS.CL·12. Mai 2026
Diese Forschung stellt Sem-ECE vor, ein neuartiges semantisches Stichprobenrahmenwerk zur Bewertung der Kalibrierung in offenen Fragenbeantwortungssystemen für große Sprachmodelle. Es adressiert die Einschränkungen bestehender Bewertungsmethoden, indem es gesampelte Antworten in semantische Klassen gruppiert, was für den zuverlässigen Einsatz von LLMs entscheidend ist.
Original lesen ↗