← heapsort-ai

DeepSeek-V4-Flash

2 items

RESEARCHDEV.to AI·vor 7T

Elemetry data: Running 284B MoE at 0.00 GB Active VRAM

Dieser Inhalt teilt Hardware-Telemetriedaten aus einem Architekturtest zur Bewertung der Ausführung von Modellen im Grenzmaßstab auf stark eingeschränkter Standardhardware. Er beschreibt das Benchmarking einer 284B-Parameter Mixture-of-Experts (MoE)-Architektur, die 0,00 GB aktiven GPU-VRAM erreichte, indem sie die physische Gewichtsspeicherung von der aktiven lokalen Grafikkartenzuweisung entkoppelte.

27