RESEARCH27

Self-Calibrating Language Models via Test-Time Discriminative Distillation

arXiv CS.CL·14. April 2026

Große Sprachmodelle sind oft überheblich und äußern hohe Sicherheit, selbst wenn sie falsch liegen. Dieses Papier stellt SECL vor, eine Testzeit-Trainingspipeline, die ein selbstüberwachtes Signal nutzt, um die Kalibrierung ohne gelabelte Daten oder menschliche Aufsicht zu verbessern.

Calibration self-supervision Overconfidence large language models Test-Time Training

Original lesen ↗