RESEARCH27
Self-Calibrating Language Models via Test-Time Discriminative Distillation
arXiv CS.CL·14 de abril de 2026
Grandes modelos de linguagem frequentemente exibem excesso de confiança, expressando alta certeza mesmo quando estão incorretos. Este trabalho apresenta o SECL, um pipeline de treinamento em tempo de teste que utiliza um sinal auto-supervisionado para melhorar a calibração sem dados rotulados.
Ler original ↗