ARTICLE↑ trending43

Experiment: Olmo 3 7B Instruct Q1_0

Reddit r/LocalLLaMA·13 de abril de 2026

El autor intentó cuantizar OLMo-3 7B Instruct a un formato de 1-bit mediante destilación consciente de cuantificación, entrenando el modelo durante 12 horas en 4x B200 GPUs. Aunque el modelo resultante puede producir inglés básico, es generalmente inutilizable debido a bucles de repetición y falta de seguimiento de contexto, atribuido a la interrupción temprana del entrenamiento y una elección de conjunto de datos inadecuada.

OLMo-3 distillation quantization 1-bit model LLM

Leer original ↗