heapsort
RESEARCH27

EMO: Pretraining mixture of experts for emergent modularity

Hugging Face Blog·8 mai 2026

EMO propose une approche de pré-entraînement pour les modèles Mixture of Experts (MoE), visant à atteindre une modularité émergente. Cette méthode se concentre sur le développement de composants spécialisés au sein du modèle pendant la phase de pré-entraînement.

Lire l'original