← heapsort-ai

audio

4 items

NEWS↑ trendingReddit r/LocalLLaMA·12/4/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

El modelo Qwen3 ahora es compatible con la entrada de audio a través de sus versiones `qwen3-omni-moe` (multimodal con entrada de visión y audio) y `qwen3-asr` (reconocimiento automático de voz). Los modelos GGUF para Qwen3-Omni (variantes de 30B) y Qwen3-ASR (1.7B y 0.6B) están disponibles en Hugging Face para uso de la comunidad.

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)
42
ARTICLEDEV.to AI·hace 25d

The AI Voiceover That Doesn't Sound Like a Robot

Este artículo explora cómo crear locuciones de IA atractivas que no suenen robóticas, destacando la importancia de integrar la voz con los elementos visuales. Menciona herramientas como ElevenLabs y el uso de SSML para un control preciso sobre el ritmo y el tono, tratando la voz como la directora del contenido visual.

26