← heapsort-ai

GPU

46 items

DOCDEV.to AI·vor 16T

로컬 LLM 셋업 가이드 (v16)

Dieser Leitfaden erklärt, wie man große Sprachmodelle (LLMs) lokal einrichtet und ausführt, detailliert Hardware-Voraussetzungen wie eine NVIDIA GPU und ausreichend RAM, und vergleicht Frameworks wie llama.cpp und Ollama. Er enthält Schritt-für-Schritt-Anleitungen zur Installation von llama.cpp und zum Ausführen eines Modells mit GPU-Beschleunigung.

28
NEWSDEV.to AI·vor 24T

Cerebras IPO Challenges GPU Scaling Orthodoxy

Cerebras Systems hat am 21. April 2026 einen IPO-Antrag eingereicht und wettet darauf, dass Wafer-Scale-Chips Nvidias GPU-Cluster-Modell für KI-Workloads stören können. Das Unternehmen strebt an, die GPU-Dominanz zu verdrängen, indem es den Overhead der verteilten Berechnungen von Multi-GPU-Systemen vermeidet.

27
DOCDEV.to AI·vor 16T

로컬 LLM 셋업 가이드 (v14)

Dieser Leitfaden (v14) beschreibt die Einrichtung lokaler LLMs, einschließlich Hardware-Anforderungen (RAM, VRAM), unterstützter Betriebssysteme und Systeminformationsprüfungen. Er vergleicht Frameworks wie llama.cpp, Ollama, vLLM und LocalAI und bietet eine Schritt-für-Schritt-Anleitung zur Installation von Abhängigkeiten, Kompilierung von llama.cpp, Herunterladen eines Modells und Ausführung eines Servers vor Ort.

27
NEWSDEV.to AI·4/27/2026

26 Seconds to Find a Straggler: Fleet v0.10 End-to-End on A100 and GH200

Ingero Fleet v0.10 FOSS wurde veröffentlicht und auf A100- und GH200-Clustern validiert, wobei die Fähigkeit des GPU-Knoten-Überwachungstools demonstriert wurde, einen „Straggler“-Knoten in etwa 26-30 Sekunden zu erkennen. Diese End-to-End-Validierung bestätigt die Effektivität von Fleet bei der schnellen Identifizierung von Leistungsengpässen in Hochleistungsrechenumgebungen.

27
DOCDEV.to AI·vor 18T

Running Flux Schnell (12B) + LLMs on a Legacy AMD RX 580 (8GB) via Native Vulkan — Full Architecture Guide [2026]

Dieser Leitfaden beschreibt, wie Flux Schnell (12B) und LLMs auf einer älteren AMD RX 580 (8 GB) GPU über natives Vulkan ausgeführt werden können, was die Annahme widerlegt, dass diese Karte für KI im Jahr 2026 unbrauchbar sei. Die Lösung beinhaltet die native Kompilierung von stable-diffusion.cpp mit GGML_VULKAN=ON, wodurch eine direkte GPU-Nutzung ohne ROCm oder CUDA ermöglicht wird.

27
RESEARCHarXiv CS.AI·vor 19T

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

Mahjax ist eine neue, vollständig vektorisierte Riichi Mahjong-Umgebung, implementiert in JAX, die eine großflächige Rollout-Parallelisierung auf GPUs für die Forschung im Bereich des Reinforcement Learnings ermöglicht. Sie erleichtert das Tabula-rasa-Lernen und enthält ein hochwertiges Visualisierungstool zur Fehlerbehebung und Interaktion mit trainierten Agenten.

27
ARTICLEDEV.to AI·vor 28T

Practical Gemma 4 Benchmarking with LM Studio

Dieser Artikel behandelt das praktische Benchmarking von Gemma 4 mit LM Studio und konzentriert sich darauf, wie VRAM und GPU-Offloading die Zugänglichkeit größerer Modelle auf lokalen Systemen beeinflussen. Er beleuchtet die praktischen Gründe für den Betrieb lokaler KI-Modelle, wie Datenschutz, im Gegensatz zu gehosteten KI-Diensten.

26