Human Preference

2 items

RESEARCH↑ trendingReddit r/MachineLearning·22/04/2026

Training-time intervention yields 63.4% blind-pair human preference at matched val-loss (1.2B params, 320 judgments, p = 1.98 × 10⁻⁵) [R]

Une intervention au moment de l'entraînement pour des modèles de langage de 1,2 milliard de paramètres, utilisant une fonction de gain pondérée par la précision et des gradients ajustés par divergence, a entraîné une préférence humaine significativement plus élevée (63,4 %, p < 0,00002) par rapport à l'entraînement standard. Il est notable que ce changement de préférence s'est produit sans altérer la métrique de perte de validation agrégée, indiquant que les interventions d'entraînement au-delà du RLHF peuvent être efficaces.

LLMs machine learning Human Preference training methods

RESEARCHarXiv CS.CL·04/05/2026

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

Cette recherche explore des méthodes efficaces pour évaluer les grands modèles audio (LAMs) en utilisant des sous-ensembles de données minimaux, atteignant une corrélation élevée avec les benchmarks complets. Elle montre également que les modèles de régression entraînés sur ces sous-ensembles peuvent mieux prédire les préférences humaines pour la satisfaction des utilisateurs que les benchmarks complets.

Model Evaluation efficiency Benchmarks Large Audio Models