Human Preference

2 items

RESEARCH↑ trendingReddit r/MachineLearning·22/4/2026

Training-time intervention yields 63.4% blind-pair human preference at matched val-loss (1.2B params, 320 judgments, p = 1.98 × 10⁻⁵) [R]

Una intervención durante el entrenamiento para LMs de 1.2B parámetros, utilizando una función de ganancia ponderada por precisión y gradientes escalados por divergencia, resultó en una preferencia humana significativamente mayor (63.4%, p < 0.00002) en comparación con el entrenamiento estándar. Es destacable que esta mejora en la preferencia se produjo sin alterar la métrica agregada de pérdida de validación, lo que indica que las intervenciones de entrenamiento más allá del RLHF pueden ser efectivas.

LLMs machine learning Human Preference training methods

RESEARCHarXiv CS.CL·4/5/2026

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

Esta investigación explora métodos eficientes para evaluar Grandes Modelos de Audio (LAMs) utilizando subconjuntos mínimos de datos, logrando una alta correlación con los benchmarks completos. También demuestra que los modelos de regresión entrenados en estos subconjuntos pueden predecir mejor las preferencias humanas para la satisfacción del usuario que los benchmarks completos.

Model Evaluation efficiency Benchmarks Large Audio Models