heapsort
RESEARCH27

Distillation that keeps confidence honest

DEV.to AI·10 de mayo de 2026

La destilación en política (OPD) tradicional provoca que los modelos estudiantes más pequeños muestren un exceso de confianza debido al acceso del modelo maestro a un contexto privilegiado. Un nuevo trabajo formaliza esta discrepancia y propone CaOPD para corregir esta ilusión de certeza sin sacrificar las ganancias de precisión.

Leer original