MaskMoE verbessert das Token-Lernen in MoE-Modellen, indem es die Leistung seltener Tokens steigert.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
MaskMoE verbessert das Token-Lernen in MoE-Modellen, indem es die Leistung seltener Tokens steigert.
― 6 min Lesedauer