audio

4 items

NEWS↑ trendingHacker News (AI)·hace 9d

Is that song AI-generated? UChicago scientists create tool to check

Científicos de la Universidad de Chicago crearon una extensión de navegador para detectar música generada por inteligencia artificial. Esta herramienta aborda la creciente preocupación por la autenticidad de las pistas de audio y el uso de la IA en la creación musical.

authenticity AI detection music audio

NEWS↑ trendingReddit r/LocalLLaMA·12/4/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

El modelo Qwen3 ahora es compatible con la entrada de audio a través de sus versiones `qwen3-omni-moe` (multimodal con entrada de visión y audio) y `qwen3-asr` (reconocimiento automático de voz). Los modelos GGUF para Qwen3-Omni (variantes de 30B) y Qwen3-ASR (1.7B y 0.6B) están disponibles en Hugging Face para uso de la comunidad.

multimodal AI audio GGUF Qwen3

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

ARTICLEDEV.to AI·hace 25d

The AI Voiceover That Doesn't Sound Like a Robot

Este artículo explora cómo crear locuciones de IA atractivas que no suenen robóticas, destacando la importancia de integrar la voz con los elementos visuales. Menciona herramientas como ElevenLabs y el uso de SSML para un control preciso sobre el ritmo y el tono, tratando la voz como la directora del contenido visual.

ElevenLabs video production audio SSML

ARTICLEDEV.to AI·15/4/2026

Multi-Modal Prompting: Images, Audio & Video AI Guide

Este contenido introduce una guía avanzada sobre prompting multimodal, que abarca IA de imágenes, audio y vídeo. Dirige a los usuarios a la guía completa de 12 minutos en AI Prompt Architect, la cual utiliza el marco STCO.

prompt-engineering Images audio multi-modal AI