← heapsort-ai

audio

4 items

NEWS↑ trendingReddit r/LocalLLaMA·12/04/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

Le modèle Qwen3 prend désormais en charge l'entrée audio via ses versions `qwen3-omni-moe` (multimodale avec entrée vision et audio) et `qwen3-asr` (reconnaissance automatique de la parole). Des modèles GGUF pour Qwen3-Omni (variantes 30B) et Qwen3-ASR (1.7B et 0.6B) sont disponibles sur Hugging Face pour la communauté.

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)
42
ARTICLEDEV.to AI·il y a 25j

The AI Voiceover That Doesn't Sound Like a Robot

Cet article explique comment créer des voix off IA captivantes qui ne semblent pas robotiques, en soulignant l'importance d'intégrer la voix aux éléments visuels. Il met en avant des outils comme ElevenLabs et l'utilisation de SSML pour un contrôle précis du rythme et du ton, traitant la voix comme la directrice du contenu visuel.

26