RESEARCHDEV.to AI·10/5/2026
Distillation that keeps confidence honest
La destilación en política (OPD) tradicional provoca que los modelos estudiantes más pequeños muestren un exceso de confianza debido al acceso del modelo maestro a un contexto privilegiado. Un nuevo trabajo formaliza esta discrepancia y propone CaOPD para corregir esta ilusión de certeza sin sacrificar las ganancias de precisión.
27