audio

4 items

NEWS↑ trendingHacker News (AI)·vor 9T

Is that song AI-generated? UChicago scientists create tool to check

Wissenschaftler der University of Chicago haben eine Browser-Erweiterung entwickelt, um KI-generierte Musik zu erkennen. Dieses Tool begegnet der wachsenden Besorgnis über die Authentizität von Audiotracks und den zunehmenden Einsatz von KI in der Musikproduktion.

authenticity AI detection music audio

NEWS↑ trendingReddit r/LocalLLaMA·4/12/2026

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

Das Qwen3-Modell unterstützt nun Audioeingaben über seine Versionen `qwen3-omni-moe` (multimodal mit Seh- und Audioeingabe) und `qwen3-asr` (Audio-Spracherkennung). GGUF-Modelle für Qwen3-Omni (30B-Varianten) und Qwen3-ASR (1.7B und 0.6B) stehen auf Hugging Face zur gemeinschaftlichen Nutzung bereit.

multimodal AI audio GGUF Qwen3

mtmd: qwen3 audio support (qwen3-omni and qwen3-asr)

ARTICLEDEV.to AI·vor 25T

The AI Voiceover That Doesn't Sound Like a Robot

Dieser Artikel behandelt, wie man ansprechende KI-Voiceovers erstellt, die nicht roboterhaft klingen, und betont die Integration der Stimme mit den visuellen Elementen. Er erwähnt Tools wie ElevenLabs und die Verwendung von SSML für präzise Kontrolle über Tempo und Ton, wobei die Stimme als Regisseur der visuellen Inhalte behandelt wird.

ElevenLabs video production audio SSML

ARTICLEDEV.to AI·4/15/2026

Multi-Modal Prompting: Images, Audio & Video AI Guide

Dieser Inhalt stellt einen fortgeschrittenen Leitfaden zum multimodalen Prompting vor, der Bild-, Audio- und Video-KI behandelt. Er verweist Nutzer auf den vollständigen 12-minütigen Leitfaden auf AI Prompt Architect, welcher das STCO-Framework nutzt.

prompt-engineering Images audio multi-modal AI