RESEARCH27

Calibrated Preference Learning: The Case of Label Ranking

arXiv CS.LG·1 de junio de 2026

Este documento formaliza la calibración para la clasificación probabilística de etiquetas, introduciendo una jerarquía de nociones para clasificaciones completas, subclasificaciones y top-k. Empíricamente, los modelos populares de clasificación de etiquetas suelen estar mal calibrados, con implicaciones para los modelos de recompensa RLHF.

Calibration AI models ranking machine learning RLHF

Leer original ↗