RESEARCH27
Self-Calibrating Language Models via Test-Time Discriminative Distillation
arXiv CS.CL·14 de abril de 2026
Los grandes modelos de lenguaje suelen ser demasiado confiados, expresando alta certeza incluso cuando responden incorrectamente. Este trabajo presenta SECL, un método de entrenamiento en tiempo de prueba que aprovecha una señal de auto-supervisión para mejorar la calibración sin datos etiquetados.
Leer original ↗