MoEの効率を最大化する MoEの効率を最大化する 。 新しい指標がMoEデプロイ戦略を変革する 機械学習 専門家のミクスチャーで言語モデルを革新する Mixture-of-Expertsのアーキテクチャが言語モデルの性能をどうやって向上させるか。 Yao Fu, Yinsicheng Jiang, Yeqi Huang Mar 31, 2025 ― 1 分で読む