Novos métodos melhoram o desempenho dos modelos de linguagem otimizando o uso de memória.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos melhoram o desempenho dos modelos de linguagem otimizando o uso de memória.
― 6 min ler
Combinar o SmoothQuant com o GPTQ melhora a eficiência e o desempenho de modelos de linguagem grandes.
― 7 min ler