RESEARCH27

Self-Calibrating Language Models via Test-Time Discriminative Distillation

arXiv CS.CL·14 avril 2026

Les grands modèles de langage sont souvent trop confiants, exprimant une grande certitude même lorsqu'ils sont incorrects. Cet article présente SECL, un pipeline d'entraînement en temps de test qui exploite un signal auto-supervisé pour améliorer la calibration sans nécessiter de données étiquetées.

Calibration self-supervision Overconfidence large language models Test-Time Training

Lire l'original ↗