RESEARCH28

Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment

arXiv CS.CL·4. Mai 2026

Diese Forschung untersucht effiziente Methoden zur Bewertung großer Audiomodelle (LAMs) mithilfe minimaler Daten-Teilmengen, die eine hohe Korrelation mit vollständigen Benchmarks erreichen. Sie zeigt auch, dass Regressionsmodelle, die auf diesen Teilmengen trainiert wurden, menschliche Präferenzen für die Benutzerzufriedenheit besser vorhersagen können als vollständige Benchmarks.

Model Evaluation efficiency Benchmarks Large Audio Models Human Preference

Original lesen ↗