A Fine-tuned Wav2vec 2.0/HuBERT Benchmark For Speech Emotion Recognition,Speaker Verification and Spoken Language Understanding
Dieser Inhalt präsentiert einen Benchmark für feinabgestimmte Wav2vec 2.0- und HuBERT-Modelle in kritischen Sprachverarbeitungsaufgaben. Er bewertet deren Leistung in der Sprachemotionserkennung, Sprecherverifikation und dem Verstehen gesprochener Sprache.