RESEARCH27

Distillation that keeps confidence honest

DEV.to AI·10. Mai 2026

Traditionelle On-Policy-Destillation (OPD) führt dazu, dass kleinere Schülermodelle übermäßiges Vertrauen zeigen, da das größere Lehrermodell Zugang zu privilegiertem Kontext hat. Neue Forschung formalisiert diese Diskrepanz und schlägt CaOPD vor, um diese Gewissheitsillusion ohne Einbußen bei der Genauigkeit zu korrigieren.

Confidence Calibration distillation model training machine learning LLM

Original lesen ↗