← heapsort-ai

hardware

55 items

NEWS↑ trendingHacker News (AI)·vor 8T

Nvidia and Microsoft Reinvent Windows PCs for the Age of Personal AI

Nvidia und Microsoft arbeiten zusammen, um eine neue Generation von Windows AI-PCs mit GeForce RTX GPUs zu betreiben und Benutzern fortschrittliche persönliche KI-Funktionen zu bieten. Diese Initiative, die Project G-Assist und Nvidia ACE umfasst, zielt darauf ab, generative KI-Agenten zu integrieren und Anwendungen wie Microsoft Copilot direkt auf dem Gerät zu beschleunigen.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·4/30/2026

Follow-up: Qwen3.6-27B on 1× RTX 3090 — pushing to ~218K context + ~50–66 TPS, tool calls now stable (PN12 fix)

Dieses Update beschreibt den Betrieb von Qwen3.6-27B auf einer einzelnen RTX 3090, wodurch ein Kontext von ~218K und stabile Werkzeugaufrufe bei 50-66 TPS erreicht werden. Ein kritisches Speicherproblem bei langen Werkzeugausgaben wurde durch die Behebung eines Ankerdrifts in einem Genesis-Patch (PN12) für vLLM gelöst.

42
ARTICLE↑ trendingReddit r/LocalLLaMA·4/22/2026

Is a high-end private local LLM setup worth it?

Der Nutzer hinterfragt den Nutzen eines High-End-Local-LLM-Setups, unter Verweis auf hohe Kosten, Einrichtungsschwierigkeiten und wahrgenommene Leistungslücken im Vergleich zu Cloud-Diensten wie Claude und GPT. Er ist bereit, in leistungsstarke Hardware zu investieren, möchte aber wissen, ob diese wirklich die Geschwindigkeit und Intelligenz der Top-Kommerzmodelle erreichen kann.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·5/7/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

Der Benutzer sucht Rat bei der Wahl zwischen einer RTX 5090 und einem M5 Max 128GB für die Entwicklung von Agenten-Software mit Qwen3.6 27B lokal. Die RTX 5090 bietet die dreifache Geschwindigkeit, während der M5 Max die vierfache Speicherkapazität bereitstellt, was einen Kompromiss zwischen schneller Codegenerierung und größerer Kontextkapazität darstellt.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/9/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/27/2026

Guys this is so fun!

Ein Nutzer äußert seine Begeisterung, verschiedene KI-Modelle wie Qwen und Llama lokal auf seinem MacBook Air und einer KI-Workstation mit einer RTX Pro 6000 Blackwell auszuführen, wobei er Tools wie LM Studio und LM Link verwendet.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/21/2026

2x 512gb ram M3 Ultra mac studios

Ein Benutzer mit zwei High-End M3 Ultra Mac Studios (jeweils 512 GB RAM, 25.000 $ Hardware) testet LLM-Modelle wie Deepseek und GLM und bittet die Community um Vorschläge, welche Modelle noch geladen werden sollen. Er behebt auch Backend-Probleme und wartet auf Optimierungen für Kimi 2.6.

2x 512gb ram M3 Ultra mac studios
41
NEWS↑ trendingReddit r/LocalLLaMA·4/12/2026

Weekend project with Intel B70s

Ein Benutzer baut ein High-End-System mit Intel Arc B70 GPUs und einem Gigabyte B850 AI Top Mainboard. Ziel ist es, das Gemma 4 Modell in juristischen RAG-Anwendungen unter Verwendung eines Hermes-Agenten zu testen.

38
RESEARCH↑ trendingReddit r/LocalLLaMA·4/19/2026

QWEN3.6 + ik_llama is fast af

Ein Benutzer berichtete, dass das Modell Qwen3.6 + ik_llama mit über 50 Tokens/Sekunde bei einem Kontextfenster von 200k auf 16 GB VRAM und 32 GB RAM lief. Dies ist ein signifikanter Leistungsbenchmark für große Sprachmodelle.

QWEN3.6 + ik_llama is fast af
38
NEWS↑ trendingReddit r/LocalLLaMA·5/4/2026

Ryzen AI Max+ 495 (Gorgon Halo) with 192GB VRAM!

Lecks deuten darauf hin, dass der AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) eine APU mit 192 GB VRAM aufweisen könnte, was eine vielversprechende Zukunft für lokale KI signalisiert. Trotz potenziell hoher Kosten aufgrund der Speicherkrise wird spekuliert, dass zukünftige Versionen wie der Medusa Halo im Jahr 2027 256 GB erreichen könnten.

38
ARTICLEDEV.to AI·4/14/2026

OpenClaw on Raspberry Pi 5: Full Setup Guide

Der Artikel beschreibt, dass der Raspberry Pi 5 nun leistungsstark genug ist, um OpenClaw KI-Agenten-Workloads komfortabel auszuführen, und somit eine kostengünstige sowie private Alternative zum Cloud-Hosting bietet. Zudem werden die Spezifikationen des Pi 5 aufgeführt, die ihn für diesen Zweck praktikabel machen.

37
ARTICLE↑ trendingReddit r/LocalLLaMA·5/6/2026

Bad news: Apple drops high-memory Mac Studio configs

Apple hat die hochspeicherigen Mac Studio-Konfigurationen stillschweigend eingestellt, wodurch die M3 Ultra-Version auf maximal 96 GB RAM und der Mac mini auf 48 GB begrenzt sind. Diese Änderung ist ein erheblicher Rückschlag für Benutzer, die große KI-Modelle lokal ausführen möchten, da High-Memory-Optionen für solche Aufgaben entscheidend waren.

Bad news: Apple drops high-memory Mac Studio configs
36