heapsort
RESEARCH27

A Semantic-Sampling Framework for Evaluating Calibration in Open-Ended Question Answering

arXiv CS.CL·12. Mai 2026

Diese Forschung stellt Sem-ECE vor, ein neuartiges semantisches Stichprobenrahmenwerk zur Bewertung der Kalibrierung in offenen Fragenbeantwortungssystemen für große Sprachmodelle. Es adressiert die Einschränkungen bestehender Bewertungsmethoden, indem es gesampelte Antworten in semantische Klassen gruppiert, was für den zuverlässigen Einsatz von LLMs entscheidend ist.

Original lesen