hardware

55 items

NEWS↑ trendingReddit r/LocalLLaMA·vor 26T

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

NVIDIA bereitet angeblich eine Preiserhöhung für die RTX 5090 und möglicherweise weitere RTX 50 und PRO Serien vor, aufgrund steigender GDDR7-Speicherkosten. Diese Nachricht deutet auf eine potenzielle Erhöhung der Preise für die kommenden Grafikkarten des Unternehmens hin.

RTX 5090 GPUs hardware NVIDIA

NVIDIA Reportedly Prepares RTX 5090 Price Hike Amid Rising GDDR7 Costs (maybe RTX 50 and PRO series as well)

ARTICLEDEV.to AI·vor 19T

Designing with Nvidia's Ising Quantum AI: A Calibration Playbook for ML Engineers

Nvidias Ising-Quanten-KI-Modelle sind kombinatorische Optimierer, die hochdimensionale Hardwarezustände in energiearme Konfigurationen abbilden, um optimale Betriebspunkte zu gewährleisten. Die Bereitstellung dieser Technologie als Dienst erfordert eine sorgfältige Kalibrierung, um eine zuverlässige Konvergenz sicherzustellen und zu verhindern, dass sie von Bedienern umgangen wird.

Optimization ML Engineering hardware NVIDIA

ARTICLEDEV.to AI·vor 23T

i ran frontier ai entirely on my own hardware for months, and i can't go back

Der Autor betrieb monatelang erfolgreich Frontier-KI vollständig auf seiner eigenen Hardware, angetrieben von Frustrationen über die Abhängigkeit von zentralisierter Cloud-Infrastruktur, Latenz, Kosten und Datenschutzbedenken. Er glaubt, dass lokale KI die wahre Zukunft der Technologie darstellt.

privacy Gemma 4 security Local AI

ARTICLEDEV.to AI·4/23/2026

Agentic AI Needs Different Silicon

Der Inhalt beleuchtet, dass Googles neue TPU 8T und 8I Chips speziell für agentische KI entwickelt wurden, die in zustandsbehafteten, mehrstufigen Schleifen arbeitet, anders als die traditionelle zustandslose LLM-Inferenz. Dies stellt eine grundlegende Verschiebung in der Hardware-Architektur dar, bei der der KV-Cache als persistenter Speicher für Agenten entscheidend wird, die über die Zeit hinweg denken und handeln.

AI compute Google Agentic AI hardware

ARTICLEDEV.to AI·4/17/2026

I Run 14 AI Agents 24/7 on a 16GB MacBook — Here's What Broke First

Der Autor betreibt 14 KI-Agenten rund um die Uhr auf einem 16GB MacBook, was die gängige Meinung infrage stellt, dass leistungsstarke Hardware für ernsthafte KI-Anwendungen unerlässlich ist. Diese Agenten, die ein echtes Geschäft orchestrieren, werden in Wellen verwaltet, wobei nur 1-3 gleichzeitig ausgeführt werden, um einen persistenten Zustand aufrechtzuerhalten.

AI orchestration LLMs Local AI hardware

ARTICLEDEV.to AI·5/3/2026

I wrote a custom CUDA inference engine to run Qwen3.5-27B on $130 mining cards

Ein Entwickler hat eine benutzerdefinierte CUDA-Inferenz-Engine erstellt, um das große Sprachmodell Qwen3.5-27B erfolgreich auf kostengünstigen Mining-Grafikkarten zu betreiben. Dieser innovative Ansatz zeigt eine erhebliche Hardware-Optimierung, wodurch leistungsstarke KI-Modelle auf erschwinglicher Consumer-Hardware zugänglicher werden.

CUDA Optimization inference hardware

ARTICLEDEV.to AI·4/16/2026

Inside NVIDIA’s $2B Marvell Deal: What NVLink Fusion Means for AI Ethernet Fabrics

NVIDIAs 2-Milliarden-Dollar-Deal mit Marvell, der sich auf NVLink Fusion konzentriert, ist ein strategischer Schritt zur Fabric-Kontrolle für KI-Ethernet-Fabrics, weit mehr als nur ein Chip-Geschäft. Dies signalisiert, dass optische Verbindungen und Rack-Scale-Integration zum neuen Schlachtfeld der KI-Infrastruktur werden und die Designansätze von Netzwerk-Teams grundlegend verändern.

Networking AI infrastructure hardware

ARTICLEDEV.to AI·4/12/2026

How I Run an AI Agent 24/7 on a Mac Mini — The Full Setup

Dieser Artikel beschreibt die Einrichtung für den 24/7-Betrieb eines KI-Agenten namens Joey auf einem Mac Mini. Er deckt Hardware, Software und Kosten ab und hebt die Energieeffizienz sowie Kosteneffizienz des Mac Mini gegenüber Cloud-Lösungen hervor.

Custo-benefício AI agent Automação Mac Mini

ARTICLEDEV.to AI·vor 15T

Most people starting with local LLMs jump straight to 4-bit quantization because it's fast and uses

Dieser Artikel vergleicht die 16-, 8- und 4-Bit-Quantisierung von LLMs und zeigt, dass 4-Bit, obwohl schneller, die Qualität bei Denk- und mathematischen Aufgaben erheblich beeinträchtigt. Der eigentliche Kompromiss liegt zwischen der Aufgabe und der erforderlichen Präzision, wobei 8-Bit optimal für präzise Aufgaben ist und minimalen Qualitätsverlust bei geringfügiger Geschwindigkeitseinbuße bietet. Die Wahl der Quantisierung sollte auf der Aufgabe und Hardware-Überlegungen basieren, nicht nur auf der Hardware.

inference speed model performance quantization hardware

ARTICLEDEV.to AI·vor 24T

Built an open-source picker that recommends the right self-hosted LLM for your hardware

Ein Open-Source-Picker wurde entwickelt, der selbst gehostete große Sprachmodelle (LLMs) basierend auf der spezifischen Hardware des Benutzers, einschließlich Plattform und verfügbarem VRAM, empfiehlt. Das Projekt bietet außerdem ein kuratiertes Modellverzeichnis, Installationsanleitungen für Ollama, llama.cpp und LM Studio sowie ein Glossar für Neulinge.

open-source self-hosting hardware guides

ARTICLEDEV.to AI·4/25/2026

The Rise of Local AI: Running LLMs on Your Own Hardware in 2026

Bis 2026 wird das Ausführen leistungsstarker KI-Modelle lokal auf eigener Hardware zum Mainstream, was erhebliche Vorteile bei Datenschutz und null Grenzkosten im Vergleich zu Cloud-Diensten bietet. Diese Entwicklung adressiert Bedenken hinsichtlich der Übertragung sensibler Daten an Dritte und eliminiert Abonnementgebühren.

privacy security Local AI hardware

ARTICLEDEV.to AI·vor 19T

The Pillars of Progress: Navigating AI Infrastructure and GPU Scaling

Künstliche Intelligenz ist eine transformative Kraft, wobei GPUs entscheidend für ihre Rechenleistung sind. Das Verständnis der KI-Infrastruktur und der GPU-Skalierung ist für Unternehmen, die das volle Potenzial dieser Technologie nutzen wollen, von größter Bedeutung.

GPU scaling AI infrastructure hardware Computational power

NEWSDEV.to AI·5/7/2026

Nvidia Ships AI Factory Blueprints: 4-Node to 128-Cluster Specs

Nvidia hat drei validierte Blaupausen für KI-Rechenzentren veröffentlicht, die 4-Knoten-RTX PRO bis 128-Knoten-NVL72-Cluster umfassen und auf agentische KI sowie Modelle mit Billionen Parametern abzielen. Diese Enterprise Reference Architectures bieten reproduzierbare Infrastrukturdesigns für den Einsatz von KI-Fabriken.

AI models data centers AI infrastructure hardware

ARTICLEDEV.to AI·vor 9T

Best Local AI Models for Apple Silicon in 2026

Der Artikel behandelt die bedeutende Veränderung beim lokalen Ausführen von KI-Modellen auf Apple Silicon Macs, was zuvor dedizierte NVIDIA GPUs erforderte. Dieser Wandel wird durch die vereinheitlichte Speicherarchitektur von Apple Silicon ermöglicht, die den RAM effizient über Komponenten hinweg nutzt.

mac apple-silicon Local AI hardware

DOCDEV.to AI·vor 16T

로컬 LLM 셋업 가이드 (v12)

Dies ist ein praktischer Leitfaden für die Bereitstellung lokaler LLMs, der Hardware-, Betriebssystem- und Installationsvoraussetzungen detailliert beschreibt. Er vergleicht Frameworks wie llama.cpp, Ollama und vLLM für unterschiedliche Entwicklungs- und Leistungsanforderungen.

learning guide hardware local deployment

DOCDEV.to AI·vor 18T

在老旧 AMD RX 580 (8GB) 上通过原生 Vulkan 运行 Flux Schnell (12B) + LLM — 完整架构指南 [2026]

Dieser technische Leitfaden zeigt, wie LLMs und Stable Diffusion Modelle im Jahr 2026 auf einer alten AMD RX 580 GPU ausgeführt werden können, indem KI-Softwarebeschränkungen umgangen werden. Er beschreibt die Verwendung von nativem Vulkan mit der ggml-Engine für effiziente Inferenz und beweist die Machbarkeit älterer Hardware.

Vulkan hardware ggml AI inference

ARTICLEDEV.to AI·vor 29T

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

Der Artikel rät von der Standardverwendung von Q4_K_M für die lokale LLM-Inferenz ab und betont, dass optimale Leistung durch das Testen von Quantisierungsstufen erzielt wird, die auf spezifische Workflows zugeschnitten sind. Er schlägt vor, dass aggressive Quantisierung wie Q3_K_S die Latenz erheblich reduzieren kann, mit kaum wahrnehmbarem Qualitätsverlust für viele Aufgaben, obwohl die Kontextlänge einen Kompromiss darstellt.

Optimization LLMs quantization hardware

NEWSThe Verge AI·vor 7T

Microsoft Build 2026: All the news about Windows, AI, RTX Spark, and more

Die jährliche Entwicklerkonferenz Microsoft Build 2026 steht kurz bevor, mit erwarteten Ankündigungen zu neuen KI-Modellen, einer Copilot "Super-App" und großen Änderungen an Windows 11. Die Veranstaltung wird voraussichtlich auch neue Hardware wie den Surface Laptop Ultra mit Nvidia RTX Spark und Project Solara, Microsofts KI-Agenten-Betriebssystem, vorstellen.

Windows Developer Conference Microsoft AI

NEWSThe Verge AI·5/5/2026

OpenAI is reportedly launching a phone for ChatGPT

OpenAI entwickelt Berichten zufolge ein ChatGPT-Smartphone, das erste Hardwareprodukt des Unternehmens, mit Massenproduktion ab Anfang 2027. Das Gerät soll einen angepassten MediaTek Dimensity 9600 Chip mit verbessertem Bildsignalprozessor verwenden.

smartphone tech news OpenAI ChatGPT

NEWSMIT Tech Review AI·4/21/2026

Analog computing from waste heat

Ein Team des MIT unter der Leitung von Giuseppe Romano hat eine analoge Rechenmethode entwickelt, die Abwärme von elektronischen Geräten zur Datenverarbeitung nutzt und somit keinen Strom benötigt. Dieser neuartige Ansatz kodiert Eingabedaten, ohne auf binäre 1en und 0en angewiesen zu sein.

analog computing sustainable computing Energy Efficiency hardware