audio

4 items

NEWS↑ trendingHacker News (AI)·il y a 9j

Is that song AI-generated? UChicago scientists create tool to check

Des scientifiques de l'Université de Chicago ont développé une extension de navigateur pour détecter la musique générée par l'IA. Cet outil répond aux préoccupations croissantes concernant l'authenticité des pistes audio et l'utilisation croissante de l'IA dans la création musicale.

authenticity AI detection music audio

NEWS↑ trendingReddit r/LocalLLaMA·12/04/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

Le modèle Qwen3 prend désormais en charge l'entrée audio via ses versions `qwen3-omni-moe` (multimodale avec entrée vision et audio) et `qwen3-asr` (reconnaissance automatique de la parole). Des modèles GGUF pour Qwen3-Omni (variantes 30B) et Qwen3-ASR (1.7B et 0.6B) sont disponibles sur Hugging Face pour la communauté.

multimodal AI audio GGUF Qwen3

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

ARTICLEDEV.to AI·il y a 25j

The AI Voiceover That Doesn't Sound Like a Robot

Cet article explique comment créer des voix off IA captivantes qui ne semblent pas robotiques, en soulignant l'importance d'intégrer la voix aux éléments visuels. Il met en avant des outils comme ElevenLabs et l'utilisation de SSML pour un contrôle précis du rythme et du ton, traitant la voix comme la directrice du contenu visuel.

ElevenLabs video production audio SSML

ARTICLEDEV.to AI·15/04/2026

Multi-Modal Prompting: Images, Audio & Video AI Guide

Ce contenu présente un guide avancé sur le prompting multimodal, couvrant l'IA des images, de l'audio et de la vidéo. Il renvoie les utilisateurs au guide complet de 12 minutes sur AI Prompt Architect, qui utilise le cadre STCO.

prompt-engineering Images audio multi-modal AI