Ilya Soloveychik

Novos métodos melhoram o desempenho dos modelos de linguagem otimizando o uso de memória.

2025-08-29T22:15:42+00:00 ― 6 min ler

Combinar o SmoothQuant com o GPTQ melhora a eficiência e o desempenho de modelos de linguagem grandes.

2025-08-11T22:23:42+00:00 ― 7 min ler