NEWSDEV.to AI·il y a 15j
ModelBest Drops BitCPM-CANN: First 1.58-bit LLM on Ascend 910B
ModelBest a lancé BitCPM-CANN, le premier LLM ternaire de 1,58 bit entraîné de bout en bout sur les NPUs Ascend 910B. Ce modèle utilise 6 fois moins de VRAM que le BF16 tout en conservant la plupart de ses capacités, et il est disponible en quatre tailles open-source.
27