RESEARCH27
EMO: Pretraining mixture of experts for emergent modularity
Hugging Face Blog·8 mai 2026
EMO propose une approche de pré-entraînement pour les modèles Mixture of Experts (MoE), visant à atteindre une modularité émergente. Cette méthode se concentre sur le développement de composants spécialisés au sein du modèle pendant la phase de pré-entraînement.
Lire l'original ↗