RESEARCH28
Awakening Dormant Experts:Counterfactual Routing to Mitigate MoE Hallucinations
arXiv CS.LG·17 de abril de 2026
Los modelos Mixture-of-Experts (MoE) son propensos a alucinaciones, particularmente con conocimiento de cola larga, debido a que el enrutamiento Top-k estático subprioriza a los expertos especialistas. Se propone el Enrutamiento Contrafactual (CoR), un marco de inferencia sin entrenamiento que utiliza análisis de perturbación y CEI para desplazar dinámicamente los recursos computacionales, despertando así a estos expertos inactivos.
Leer original ↗