Explorando a esparsidade de ativação pra melhorar a eficiência de modelos de linguagem.
Yuqi Luo, Chenyang Song, Xu Han
― 6 min ler
Ciência de ponta explicada de forma simples
Explorando a esparsidade de ativação pra melhorar a eficiência de modelos de linguagem.
Yuqi Luo, Chenyang Song, Xu Han
― 6 min ler