RESEARCH27
Self-Calibrating Language Models via Test-Time Discriminative Distillation
arXiv CS.CL·14. April 2026
Große Sprachmodelle sind oft überheblich und äußern hohe Sicherheit, selbst wenn sie falsch liegen. Dieses Papier stellt SECL vor, eine Testzeit-Trainingspipeline, die ein selbstüberwachtes Signal nutzt, um die Kalibrierung ohne gelabelte Daten oder menschliche Aufsicht zu verbessern.
Original lesen ↗