heapsort
ARTICLE↑ trending43

Experiment: Olmo 3 7B Instruct Q1_0

Reddit r/LocalLLaMA·13. April 2026
Experiment: Olmo 3 7B Instruct Q1_0

Der Autor versuchte, OLMo-3 7B Instruct mittels quantisierungsbewusster Destillation in ein 1-Bit-Format zu quantisieren, indem er das Modell 12 Stunden lang auf 4x B200 GPUs trainierte. Obwohl das resultierende Modell rudimentäres Englisch erzeugen kann, ist es aufgrund von Wiederholungsschleifen und mangelnder Kontextverfolgung – zurückzuführen auf einen vorzeitigen Trainingsabbruch und eine ungeeignete Datensatzwahl – generell unbrauchbar.

Original lesen