RESEARCH28
Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment
arXiv CS.CL·4 mai 2026
Cette recherche explore des méthodes efficaces pour évaluer les grands modèles audio (LAMs) en utilisant des sous-ensembles de données minimaux, atteignant une corrélation élevée avec les benchmarks complets. Elle montre également que les modèles de régression entraînés sur ces sous-ensembles peuvent mieux prédire les préférences humaines pour la satisfaction des utilisateurs que les benchmarks complets.
Lire l'original ↗