mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)
Das Qwen3-Modell unterstützt nun Audioeingaben über seine Versionen `qwen3-omni-moe` (multimodal mit Seh- und Audioeingabe) und `qwen3-asr` (Audio-Spracherkennung). GGUF-Modelle für Qwen3-Omni (30B-Varianten) und Qwen3-ASR (1.7B und 0.6B) stehen auf Hugging Face zur gemeinschaftlichen Nutzung bereit.
