RESEARCH27
Distillation that keeps confidence honest
DEV.to AI·10. Mai 2026
Traditionelle On-Policy-Destillation (OPD) führt dazu, dass kleinere Schülermodelle übermäßiges Vertrauen zeigen, da das größere Lehrermodell Zugang zu privilegiertem Kontext hat. Neue Forschung formalisiert diese Diskrepanz und schlägt CaOPD vor, um diese Gewissheitsillusion ohne Einbußen bei der Genauigkeit zu korrigieren.
Original lesen ↗