← heapsort-ai

audio

4 items

NEWS↑ trendingReddit r/LocalLLaMA·4/12/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

Das Qwen3-Modell unterstützt nun Audioeingaben über seine Versionen `qwen3-omni-moe` (multimodal mit Seh- und Audioeingabe) und `qwen3-asr` (Audio-Spracherkennung). GGUF-Modelle für Qwen3-Omni (30B-Varianten) und Qwen3-ASR (1.7B und 0.6B) stehen auf Hugging Face zur gemeinschaftlichen Nutzung bereit.

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)
42
ARTICLEDEV.to AI·vor 25T

The AI Voiceover That Doesn't Sound Like a Robot

Dieser Artikel behandelt, wie man ansprechende KI-Voiceovers erstellt, die nicht roboterhaft klingen, und betont die Integration der Stimme mit den visuellen Elementen. Er erwähnt Tools wie ElevenLabs und die Verwendung von SSML für präzise Kontrolle über Tempo und Ton, wobei die Stimme als Regisseur der visuellen Inhalte behandelt wird.

26