RESEARCHarXiv CS.CL·14/04/2026
Self-Calibrating Language Models via Test-Time Discriminative Distillation
Grandes modelos de linguagem frequentemente exibem excesso de confiança, expressando alta certeza mesmo quando estão incorretos. Este trabalho apresenta o SECL, um pipeline de treinamento em tempo de teste que utiliza um sinal auto-supervisionado para melhorar a calibração sem dados rotulados.
27