hardware

55 items

DOC↑ trendingReddit r/LocalLLaMA·4/27/2026

To 16GB VRAM users, plug in your old GPU

Dieser Inhalt schlägt vor, dass Benutzer mit 16 GB VRAM eine alte GPU (6 GB+ VRAM) hinzufügen, um den gesamten VRAM zu erhöhen, was die Ausführung größerer LLM-Modelle (~30b) auch mit einer schwächeren Sekundärkarte ermöglicht. Es enthält ein praktisches Konfigurationsbeispiel für `llama-server`.

deep learning GPU optimization LLM inference VRAM management

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 25T

I have (even faster) DeepSeek V4 Pro at home

Der Autor hat das DeepSeek V4 Pro Modell mit ktransformers noch schneller auf seiner Heimausrüstung zum Laufen gebracht. Er beschreibt die Hardware-Anpassungen und präsentiert Leistungstests mit zunehmender Kontexttiefe.

DeepSeek Benchmarking hardware performance

NEWS↑ trendingHacker News (AI)·vor 8T

Nvidia and Microsoft Reinvent Windows PCs for the Age of Personal AI

Nvidia und Microsoft arbeiten zusammen, um eine neue Generation von Windows AI-PCs mit GeForce RTX GPUs zu betreiben und Benutzern fortschrittliche persönliche KI-Funktionen zu bieten. Diese Initiative, die Project G-Assist und Nvidia ACE umfasst, zielt darauf ab, generative KI-Agenten zu integrieren und Anwendungen wie Microsoft Copilot direkt auf dem Gerät zu beschleunigen.

Microsoft Copilot Windows AI hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·4/30/2026

Follow-up: Qwen3.6-27B on 1× RTX 3090 — pushing to ~218K context + ~50–66 TPS, tool calls now stable (PN12 fix)

Dieses Update beschreibt den Betrieb von Qwen3.6-27B auf einer einzelnen RTX 3090, wodurch ein Kontext von ~218K und stabile Werkzeugaufrufe bei 50-66 TPS erreicht werden. Ein kritisches Speicherproblem bei langen Werkzeugausgaben wurde durch die Behebung eines Ankerdrifts in einem Genesis-Patch (PN12) für vLLM gelöst.

Optimization hardware performance vLLM

ARTICLE↑ trendingReddit r/LocalLLaMA·4/22/2026

Is a high-end private local LLM setup worth it?

Der Nutzer hinterfragt den Nutzen eines High-End-Local-LLM-Setups, unter Verweis auf hohe Kosten, Einrichtungsschwierigkeiten und wahrgenommene Leistungslücken im Vergleich zu Cloud-Diensten wie Claude und GPT. Er ist bereit, in leistungsstarke Hardware zu investieren, möchte aber wissen, ob diese wirklich die Geschwindigkeit und Intelligenz der Top-Kommerzmodelle erreichen kann.

local LLM private-ai cost hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·5/7/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

Der Benutzer sucht Rat bei der Wahl zwischen einer RTX 5090 und einem M5 Max 128GB für die Entwicklung von Agenten-Software mit Qwen3.6 27B lokal. Die RTX 5090 bietet die dreifache Geschwindigkeit, während der M5 Max die vierfache Speicherkapazität bereitstellt, was einen Kompromiss zwischen schneller Codegenerierung und größerer Kontextkapazität darstellt.

LLMs GPU hardware performance

ARTICLE↑ trendingReddit r/LocalLLaMA·4/9/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·4/27/2026

Guys this is so fun!

Ein Nutzer äußert seine Begeisterung, verschiedene KI-Modelle wie Qwen und Llama lokal auf seinem MacBook Air und einer KI-Workstation mit einer RTX Pro 6000 Blackwell auszuführen, wobei er Tools wie LM Studio und LM Link verwendet.

open source models LLMs Local AI hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·4/21/2026

2x 512gb ram M3 Ultra mac studios

Ein Benutzer mit zwei High-End M3 Ultra Mac Studios (jeweils 512 GB RAM, 25.000 $ Hardware) testet LLM-Modelle wie Deepseek und GLM und bittet die Community um Vorschläge, welche Modelle noch geladen werden sollen. Er behebt auch Backend-Probleme und wartet auf Optimierungen für Kimi 2.6.

Apple AI models LLMs Mac Studio

NEWS↑ trendingReddit r/LocalLLaMA·4/12/2026

Weekend project with Intel B70s

Ein Benutzer baut ein High-End-System mit Intel Arc B70 GPUs und einem Gigabyte B850 AI Top Mainboard. Ziel ist es, das Gemma 4 Modell in juristischen RAG-Anwendungen unter Verwendung eines Hermes-Agenten zu testen.

Legal AI GPU RAG AI model

NEWS↑ trendingReddit r/LocalLLaMA·5/6/2026

ZAYA1-8B: Frontier intelligence density, trained on AMD

ZAYA1-8B, ein neues KI-Modell, das eine führende Intelligenzdichte aufweist, wurde angekündigt. Es wurde bemerkenswerterweise mit AMD-Hardware trainiert.

AI training AMD AI model hardware

ZAYA1-8B: Frontier intelligence density, trained on AMD

RESEARCH↑ trendingReddit r/LocalLLaMA·4/19/2026

QWEN3.6 + ik_llama is fast af

Ein Benutzer berichtete, dass das Modell Qwen3.6 + ik_llama mit über 50 Tokens/Sekunde bei einem Kontextfenster von 200k auf 16 GB VRAM und 32 GB RAM lief. Dies ist ein signifikanter Leistungsbenchmark für große Sprachmodelle.

Benchmarking hardware performance LLM

NEWS↑ trendingReddit r/LocalLLaMA·5/4/2026

Ryzen AI Max+ 495 (Gorgon Halo) with 192GB VRAM!

Lecks deuten darauf hin, dass der AMD Ryzen AI Max+ PRO 495 (Gorgon Halo) eine APU mit 192 GB VRAM aufweisen könnte, was eine vielversprechende Zukunft für lokale KI signalisiert. Trotz potenziell hoher Kosten aufgrund der Speicherkrise wird spekuliert, dass zukünftige Versionen wie der Medusa Halo im Jahr 2027 256 GB erreichen könnten.

Ryzen AI VRAM AMD Local AI

ARTICLEDEV.to AI·4/14/2026

OpenClaw on Raspberry Pi 5: Full Setup Guide

Der Artikel beschreibt, dass der Raspberry Pi 5 nun leistungsstark genug ist, um OpenClaw KI-Agenten-Workloads komfortabel auszuführen, und somit eine kostengünstige sowie private Alternative zum Cloud-Hosting bietet. Zudem werden die Spezifikationen des Pi 5 aufgeführt, die ihn für diesen Zweck praktikabel machen.

OpenClaw Raspberry Pi 5 AI hardware

ARTICLE↑ trendingHacker News (AI)·vor 6T

32GB of DDR5 now costs $375 – AI shortage continues to squeeze PC building

Der Preis für 32 GB DDR5-Speicher ist auf 375 US-Dollar gestiegen, angetrieben durch die anhaltende KI-Knappheit. Dieser Trend wirkt sich weiterhin auf den PC-Bau-Markt aus und verteuert Komponenten für Verbraucher.

PC building AI shortage DDR5 hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 26T

The RTX 5000 PRO (48GB) arrived and it is better than I expected.

Der Autor, ein PC-Bau-Neuling, kaufte eine RTX 5000 Pro GPU für die lokale LLM-Verarbeitung und gab insgesamt 5600 $ aus. Trotz anfänglicher Schwierigkeiten bei der Montage und Software-Einrichtung (Linux, vLLM) war die Leistung der GPU besser als erwartet.

local LLM PC Build GPU AI

ARTICLE↑ trendingReddit r/MachineLearning·4/17/2026

Which computer should I buy: Mac or custom-built 5090? [D]

Der Nutzer sucht Rat bei der Wahl zwischen einem Mac M5 MAX mit MLX und einem Custom-PC mit RTX 5090 für seine Machine-Learning-Projekte. Seine Arbeit umfasst vorwiegend das Fine-Tuning großer vortrainierter Modelle und Training von Grund auf, oft mit Bild-/Videodaten und manchmal LLMs, wodurch VRAM ein entscheidender Faktor ist.

deep learning GPU machine learning hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·5/6/2026

Bad news: Apple drops high-memory Mac Studio configs

Apple hat die hochspeicherigen Mac Studio-Konfigurationen stillschweigend eingestellt, wodurch die M3 Ultra-Version auf maximal 96 GB RAM und der Mac mini auf 48 GB begrenzt sind. Diese Änderung ist ein erheblicher Rückschlag für Benutzer, die große KI-Modelle lokal ausführen möchten, da High-Memory-Optionen für solche Aufgaben entscheidend waren.

Apple Mac Studio Local AI hardware

Bad news: Apple drops high-memory Mac Studio configs

NEWS↑ trendingReddit r/LocalLLaMA·4/26/2026

Comparison of upcoming x86 unified memory systems

Dieser Inhalt vergleicht kommende x86 Unified Memory Systeme von AMD und Intel, darunter Gorgon Halo, Strix Halo, Medusa Halo und Nova Lake AX. Er beschreibt Veröffentlichungstermine und Bandbreitenverbesserungen, wobei AMD Medusa Halo bis 2027 einen signifikanten Leistungssprung verspricht.

AI accelerators processors memory hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 19T

In theory, if I have $20k-ish to spend on hardware what would actually get me closest to local coding agent that would allow me to go totally off the social grid?

Der Benutzer fragt, welche Hardware (ungefähr 20.000 $, z.B. RTX 6000 GPUs) benötigt würde, um einen lokalen Codierungsagenten einzurichten und vollständig offline zu gehen. Die Frage berührt auch die Rolle des KI-Modells in diesem Szenario.

Coding Agent privacy Local AI hardware