Jiawei Zhao

Um novo método melhora a eficiência de memória no treinamento de grandes modelos de linguagem em hardware comum.

2025-08-31T17:26:54+00:00 ― 7 min ler

WeLore traz eficiência para grandes modelos de linguagem ao simplificar matrizes de pesos.

2025-07-13T13:42:54+00:00 ― 7 min ler