Overconfidence

2 items

RESEARCHarXiv CS.CL·14/04/2026

Self-Calibrating Language Models via Test-Time Discriminative Distillation

Grandes modelos de linguagem frequentemente exibem excesso de confiança, expressando alta certeza mesmo quando estão incorretos. Este trabalho apresenta o SECL, um pipeline de treinamento em tempo de teste que utiliza um sinal auto-supervisionado para melhorar a calibração sem dados rotulados.

Calibration self-supervision Overconfidence large language models

RESEARCHarXiv CS.AI·14d atrás

Confidence Calibration in Large Language Models

Este estudo investiga a calibração da confiança em Grandes Modelos de Linguagem (LLMs) em diversas tarefas, revelando que os LLMs atuais exibem superconfiança em testes difíceis e subconfiança em testes fáceis. Os pesquisadores desenvolveram o LifeEval, uma nova ferramenta para avaliar a calibração de modelos em diferentes níveis de dificuldade.

Confidence Calibration Overconfidence machine learning large language models