MoE : routeur, routage top-k, perte d'équilibrage, capacité, parallélisme d'experts. Paramètres totaux vs actifs (Switch, GLaM, Mixtral, DeepSeek-V3).