RESEARCH27
EMO: Pretraining mixture of experts for emergent modularity
Hugging Face Blog·8 de mayo de 2026
EMO propone un enfoque de preentrenamiento para modelos Mixture of Experts (MoE), con el objetivo de lograr modularidad emergente. Este método se centra en el desarrollo de componentes especializados dentro del modelo durante la fase de preentrenamiento.
Leer original ↗