RESEARCH27
EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs
arXiv CS.CL·26 mai 2026
EchoDistill est un cadre d'autodistillation basé sur l'alignement, conçu pour rendre les Grands Modèles de Langage Audio (ALLMs) robustes au bruit du monde réel. Il utilise un enseignant audio propre pour guider un élève audio bruyant lors de l'inférence, optimisant les réponses via l'optimisation de la politique relative au groupe et la cohérence au niveau du jeton.
Lire l'original ↗