heapsort
RESEARCH27

Self-Calibrating Language Models via Test-Time Discriminative Distillation

arXiv CS.CL·14 de abril de 2026

Los grandes modelos de lenguaje suelen ser demasiado confiados, expresando alta certeza incluso cuando responden incorrectamente. Este trabajo presenta SECL, un método de entrenamiento en tiempo de prueba que aprovecha una señal de auto-supervisión para mejorar la calibración sin datos etiquetados.

Leer original