Sayeh Sharify

Um novo método ajuda modelos de linguagem a gerar texto mais rápido e de forma mais eficiente.

2025-08-19T21:18:42+00:00 ― 6 min ler

Combinar o SmoothQuant com o GPTQ melhora a eficiência e o desempenho de modelos de linguagem grandes.

2025-08-11T22:23:42+00:00 ― 7 min ler

A ResQ otimiza grandes modelos de linguagem, melhorando o desempenho e reduzindo custos.

2025-02-20T08:07:48+00:00 ― 7 min ler