heapsort
RESEARCH27

EMO: Pretraining mixture of experts for emergent modularity

Hugging Face Blog·8 de maio de 2026

EMO propõe uma abordagem de pré-treinamento para modelos Mixture of Experts (MoE), com o objetivo de alcançar modularidade emergente. Este método concentra-se no desenvolvimento de componentes especializados dentro do modelo durante a fase de pré-treinamento.

Ler original