RESEARCH28

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

arXiv CS.CL·4 de mayo de 2026

Esta investigación explora métodos eficientes para evaluar Grandes Modelos de Audio (LAMs) utilizando subconjuntos mínimos de datos, logrando una alta correlación con los benchmarks completos. También demuestra que los modelos de regresión entrenados en estos subconjuntos pueden predecir mejor las preferencias humanas para la satisfacción del usuario que los benchmarks completos.

Model Evaluation efficiency Benchmarks Large Audio Models Human Preference

Leer original ↗