RESEARCH27
Calibrated Preference Learning: The Case of Label Ranking
arXiv CS.LG·1 de junio de 2026
Este documento formaliza la calibración para la clasificación probabilística de etiquetas, introduciendo una jerarquía de nociones para clasificaciones completas, subclasificaciones y top-k. Empíricamente, los modelos populares de clasificación de etiquetas suelen estar mal calibrados, con implicaciones para los modelos de recompensa RLHF.
Leer original ↗