Human Preference

2 items

RESEARCH↑ trendingReddit r/MachineLearning·22/04/2026

Training-time intervention yields 63.4% blind-pair human preference at matched val-loss (1.2B params, 320 judgments, p = 1.98 × 10⁻⁵) [R]

Uma intervenção no tempo de treinamento para LMs de 1.2B parâmetros, utilizando uma função de ganho ponderada por precisão e gradientes escalados por divergência, resultou em uma preferência humana significativamente maior (63,4%, p < 0.00002) em comparação com o treinamento padrão. Notavelmente, esta melhora na preferência ocorreu sem alterar a métrica agregada de perda de validação, indicando que intervenções no treinamento além do RLHF podem ser eficazes.

LLMs machine learning Human Preference training methods

RESEARCHarXiv CS.CL·04/05/2026

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

Esta pesquisa investiga métodos eficientes para avaliar Grandes Modelos de Áudio (LAMs) usando subconjuntos mínimos de dados, alcançando alta correlação com benchmarks completos. Demonstra também que modelos de regressão treinados nesses subconjuntos podem prever melhor as preferências humanas para satisfação do usuário do que os benchmarks completos.

Model Evaluation efficiency Benchmarks Large Audio Models