RESEARCH28

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

arXiv CS.CL·4 mai 2026

Cette recherche explore des méthodes efficaces pour évaluer les grands modèles audio (LAMs) en utilisant des sous-ensembles de données minimaux, atteignant une corrélation élevée avec les benchmarks complets. Elle montre également que les modèles de régression entraînés sur ces sous-ensembles peuvent mieux prédire les préférences humaines pour la satisfaction des utilisateurs que les benchmarks complets.

Model Evaluation efficiency Benchmarks Large Audio Models Human Preference

Lire l'original ↗