Confidence Calibration

2 items

RESEARCHDEV.to AI·10/5/2026

Distillation that keeps confidence honest

La destilación en política (OPD) tradicional provoca que los modelos estudiantes más pequeños muestren un exceso de confianza debido al acceso del modelo maestro a un contexto privilegiado. Un nuevo trabajo formaliza esta discrepancia y propone CaOPD para corregir esta ilusión de certeza sin sacrificar las ganancias de precisión.

Confidence Calibration distillation model training machine learning

RESEARCHarXiv CS.AI·hace 14d

Confidence Calibration in Large Language Models

Este estudio examina la calibración de la confianza en Grandes Modelos de Lenguaje (LLMs) en diversas tareas, mostrando que los LLMs actuales son demasiado confiados en pruebas difíciles y subconfiados en las fáciles. Los investigadores desarrollaron LifeEval, una nueva prueba para evaluar la calibración del modelo en diferentes niveles de dificultad.

Confidence Calibration Overconfidence machine learning large language models