audio generation

6 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/22/2026

Ultimate List: Best Open Models for Coding, Chat, Vision, Audio & More

Dieser Artikel stellt eine ultimative Liste der besten Open-Source-KI-Modelle in verschiedenen Kategorien vor, mit einem detaillierten Fokus auf Audiogenerierung. Er empfiehlt spezifische Modelle für Text-to-Speech, Stimmklonierung, Musikgenerierung und multimodales Audio, wobei deren einzigartige Stärken hervorgehoben werden.

AI models open-source AI audio generation Generative AI

NEWS↑ trendingReddit r/MachineLearning·5/1/2026

Phosphene local video and audio generation for Apple Silicon open source (LTX 2.3) [P]

Phosphene ist ein kostenloses Open-Source-Desktop-Panel für Apple Silicon Macs, das Video mit synchronisiertem Audio unter Verwendung des LTX 2.3-Modells von Lightricks generiert. Sein Alleinstellungsmerkmal ist die gleichzeitige Generierung von Video und Audio in einem einzigen Diffusionsprozess, was eine perfekte zeitliche Abstimmung gewährleistet.

Open Source AI models apple-silicon video generation

Phosphene local video and audio generation for Apple Silicon open source (LTX 2.3) [P]

NEWSGoogle DeepMind Blog·4/15/2026

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Die Gemini 3.1 Flash TTS führt ein neues Audiomodell mit granularen Audio-Tags ein. Dies ermöglicht eine präzise Steuerung der KI-Sprache, was zu einer ausdrucksvolleren Audioerzeugung führt.

expressive AI Gemini TTS AI speech

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

ARTICLEThe Verge AI·5/7/2026

OpenClaw and Claude can put your AI-generated podcasts in Spotify

Save to Spotify ist ein neues Kommandozeilen-Tool für KI-Agenten wie OpenClaw und Claude Code, das es ihnen ermöglicht, KI-generierte Audio-Zusammenfassungen und persönliche Podcasts direkt auf Spotify zu speichern. Die Einrichtung erfordert das Herunterladen des CLI von GitHub und das Hinzufügen von „und auf Spotify speichern“ zum Prompt des KI-Agenten, damit der Inhalt im Podcast-Feed erscheint.

podcasts Spotify AI tools automation

ARTICLEDEV.to AI·4/9/2026

ElevenLabs: Realistic AI Voices Without Breaking the Bank

O texto apresenta ElevenLabs, uma plataforma de IA para geração de vozes realistas, destacando seu nível gratuito capaz. Ele detalha recursos como biblioteca de vozes de IA e clonagem de voz, sendo valioso para desenvolvedores e criadores.

AI Voices ElevenLabs Voice Cloning Text-to-Speech

NEWSGoogle DeepMind Blog·3/25/2026

Lyria 3 Pro: Create longer tracks in more

Apresentando Lyria 3 Pro, que desbloqueia faixas mais longas com consciência estrutural. A Lyria também será expandida para mais produtos e superfícies do Google.

Product Update music AI Google AI structural awareness