RESEARCH27

Self-Calibrating Language Models via Test-Time Discriminative Distillation

arXiv CS.CL·14 de abril de 2026

Grandes modelos de linguagem frequentemente exibem excesso de confiança, expressando alta certeza mesmo quando estão incorretos. Este trabalho apresenta o SECL, um pipeline de treinamento em tempo de teste que utiliza um sinal auto-supervisionado para melhorar a calibração sem dados rotulados.

Calibration self-supervision Overconfidence large language models Test-Time Training

Ler original ↗