Utkarsh Saxena

Combinar o SmoothQuant com o GPTQ melhora a eficiência e o desempenho de modelos de linguagem grandes.

2025-08-11T22:23:42+00:00 ― 7 min ler

A Eigen Attention melhora a eficiência de memória para modelos de linguagem grandes processando textos longos.

2025-06-29T16:43:48+00:00 ― 7 min ler

A ResQ otimiza grandes modelos de linguagem, melhorando o desempenho e reduzindo custos.

2025-02-20T08:07:48+00:00 ― 7 min ler