Yuezhou Hu

Um novo método melhora o treinamento de modelos de linguagem esparsos enquanto minimiza a perda de desempenho.

2025-07-04T17:36:00+00:00 ― 9 min ler

Apresentando o S-STE, uma nova forma de melhorar a eficiência do treino de redes neurais esparsas.

2025-06-12T14:59:00+00:00 ― 5 min ler