heapsort
RESEARCH28

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

arXiv CS.CL·4 de maio de 2026

Esta pesquisa investiga métodos eficientes para avaliar Grandes Modelos de Áudio (LAMs) usando subconjuntos mínimos de dados, alcançando alta correlação com benchmarks completos. Demonstra também que modelos de regressão treinados nesses subconjuntos podem prever melhor as preferências humanas para satisfação do usuário do que os benchmarks completos.

Ler original
Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment — arXiv CS.CL — heapsort-ai