RESEARCH28

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

arXiv CS.CL·4 de maio de 2026

Esta pesquisa investiga métodos eficientes para avaliar Grandes Modelos de Áudio (LAMs) usando subconjuntos mínimos de dados, alcançando alta correlação com benchmarks completos. Demonstra também que modelos de regressão treinados nesses subconjuntos podem prever melhor as preferências humanas para satisfação do usuário do que os benchmarks completos.

Model Evaluation efficiency Benchmarks Large Audio Models Human Preference

Ler original ↗