Overconfidence

2 items

RESEARCHarXiv CS.CL·14/4/2026

Self-Calibrating Language Models via Test-Time Discriminative Distillation

Los grandes modelos de lenguaje suelen ser demasiado confiados, expresando alta certeza incluso cuando responden incorrectamente. Este trabajo presenta SECL, un método de entrenamiento en tiempo de prueba que aprovecha una señal de auto-supervisión para mejorar la calibración sin datos etiquetados.

Calibration self-supervision Overconfidence large language models

RESEARCHarXiv CS.AI·hace 14d

Confidence Calibration in Large Language Models

Este estudio examina la calibración de la confianza en Grandes Modelos de Lenguaje (LLMs) en diversas tareas, mostrando que los LLMs actuales son demasiado confiados en pruebas difíciles y subconfiados en las fáciles. Los investigadores desarrollaron LifeEval, una nueva prueba para evaluar la calibración del modelo en diferentes niveles de dificultad.

Confidence Calibration Overconfidence machine learning large language models