RESEARCHarXiv CS.CL·14/4/2026
Self-Calibrating Language Models via Test-Time Discriminative Distillation
Los grandes modelos de lenguaje suelen ser demasiado confiados, expresando alta certeza incluso cuando responden incorrectamente. Este trabajo presenta SECL, un método de entrenamiento en tiempo de prueba que aprovecha una señal de auto-supervisión para mejorar la calibración sin datos etiquetados.
27