RESEARCH27

Self-Calibrating Language Models via Test-Time Discriminative Distillation

arXiv CS.CL·14 de abril de 2026

Los grandes modelos de lenguaje suelen ser demasiado confiados, expresando alta certeza incluso cuando responden incorrectamente. Este trabajo presenta SECL, un método de entrenamiento en tiempo de prueba que aprovecha una señal de auto-supervisión para mejorar la calibración sin datos etiquetados.

Calibration self-supervision Overconfidence large language models Test-Time Training

Leer original ↗