← heapsort-ai

Open Source

313 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/22/2026

Qwen3 TTS is seriously underrated - I got it running locally in real-time and it's one of the most expressive open TTS models I've tried

Der Autor hat ein altes Echtzeit-ASR->LLM->TTS-Pipeline-Projekt erneut aufgegriffen und war angenehm überrascht von Qwen3 TTS. Nach viel Experimentieren gelang es ihm, das Qwen3 TTS-Modell zuverlässig für lokales Streaming zum Laufen zu bringen, wobei er dessen Ausdruckskraft und geeignete Architektur lobte.

Qwen3 TTS is seriously underrated - I got it running locally in real-time and it's one of the most expressive open TTS models I've tried
43
NEWS↑ trendingReddit r/MachineLearning·5/1/2026

Phosphene local video and audio generation for Apple Silicon open source (LTX 2.3) [P]

Phosphene ist ein kostenloses Open-Source-Desktop-Panel für Apple Silicon Macs, das Video mit synchronisiertem Audio unter Verwendung des LTX 2.3-Modells von Lightricks generiert. Sein Alleinstellungsmerkmal ist die gleichzeitige Generierung von Video und Audio in einem einzigen Diffusionsprozess, was eine perfekte zeitliche Abstimmung gewährleistet.

Phosphene local video and audio generation for Apple Silicon open source (LTX 2.3) [P]
43
NEWS↑ trendingReddit r/LocalLLaMA·4/16/2026

HY-World 2.0 just dropped

Tencent hat HY-World 2.0 veröffentlicht, das erste quelloffene, hochmoderne 3D-Weltmodell, das reale, persistente und bearbeitbare 3D-Assets generiert. Im Gegensatz zu reinen Videomodellen bietet es echte 3D-Konsistenz, native Physik und ist vollständig in gängige Spiel-Engines und 3D-Software importierbar.

42
NEWS↑ trendingReddit r/LocalLLaMA·4/22/2026

Moonshot open-sourced FlashKDA, CUTLASS kernels for Kimi Delta Attention, up to 2.22x over the Triton baseline on H20

Moonshot AI hat FlashKDA als Open Source veröffentlicht, einen CUTLASS C++ Kernel für Kimi Delta Attention, der Leistungssteigerungen von bis zu 2.22x gegenüber der Triton-Baseline auf H20-Benchmarks bietet. Diese Implementierung verbessert lineare Aufmerksamkeitsarchitekturen.

Moonshot open-sourced FlashKDA, CUTLASS kernels for Kimi Delta Attention, up to 2.22x over the Triton baseline on H20
42
ARTICLE↑ trendingHacker News (AI)·vor 12T

Show HN: Local Coding Agent with LLMs to Delegate Tool Calls to Small AI Models

Dieses Projekt stellt einen lokalen Codierungsagenten vor, der Große Sprachmodelle (LLMs) nutzt, um spezifische Aufgaben, insbesondere Werkzeugaufrufe, an kleinere, spezialisierte KI-Modelle zu delegieren. Ziel ist es, die Effizienz und Modularität in der KI-gesteuerten Entwicklung durch die Verteilung von Arbeitslasten zu verbessern.

42
RESEARCH↑ trendingReddit r/MachineLearning·4/20/2026

Open-source single-GPU reproductions of Cartridges and STILL for neural KV-cache compaction [P]

Der Autor hat zwei aktuelle Ideen, Cartridges und STILL, zur neuronalen KV-Cache-Kompaktion und Langkontext-Inferenz implementiert und als Open Source veröffentlicht. Ziel ist es, diese Forschungsideen mit Benchmark-Code einfach überprüfbar und ausführbar zu machen und sie auch mit bestehenden Methoden zu vergleichen.

42
RESEARCH↑ trendingReddit r/MachineLearning·4/27/2026

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]

Der Autor stellt Mahoraga vor, einen Open-Source-Orchestrator, der Aufgaben mittels eines kontextuellen Banditen (LinUCB) effizient zwischen lokalen und Cloud-KI-Agenten leitet. Aus persönlicher Erfahrung mit Cloud-Guthaben-Limits entstanden, optimiert das Tool die KI-Nutzung und hebt die Leistung von Qwen3 4B bei Code-Aufgaben hervor.

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]
42
RESEARCH↑ trendingReddit r/LocalLLaMA·4/27/2026

Microsoft Presents "TRELLIS.2": An Open-Source, 4b-Parameter, Image-To-3D Model Producing Up To 1536³ PBR Textured Assets, Built On Native 3D VAES With 16× Spatial Compression, Delivering Efficient, Scalable, High-Fidelity Asset Generation.

Microsofts TRELLIS.2 ist ein quelloffenes 4B-Parameter-Modell zur hochauflösenden Bild-zu-3D-Generierung, das bis zu 1536³ PBR-Textur-Assets mit nativen 3D VAES und einer neuartigen O-Voxel-Struktur erzeugt. Es bietet eine effiziente, skalierbare Lösung zur Erstellung detaillierter 3D-Assets mit vollständigen PBR-Materialien.

Microsoft Presents "TRELLIS.2": An Open-Source, 4b-Parameter, Image-To-3D Model Producing Up To 1536³ PBR Textured Assets, Built On Native 3D VAES With 16× Spatial Compression, Delivering Efficient, Scalable, High-Fidelity Asset Generation.
42
ARTICLE↑ trendingHacker News (AI)·vor 13T

Show HN: Open-Source AI Racing Harness

Dan von Elodin hat einen Open-Source-Flugsoftware-Simulations-Harness für KI-Grand-Prix-Teilnehmer veröffentlicht. Das Tool, das den Wettbewerbsbeschränkungen entspricht, läuft mit Betaflight und ermöglicht die direkte Generierung von Kamerasensoren in der Simulationsschleife, unter Verwendung der Rust Bevy Game Engine.

42