Utkarsh Saxena

Combinare SmoothQuant e GPTQ migliora l'efficienza e le prestazioni dei grandi modelli di linguaggio.

2025-08-11T22:23:42+00:00 ― 6 leggere min

Eigen Attention migliora l'efficienza della memoria per i grandi modelli linguistici che elaborano testi lunghi.

2025-06-29T16:43:48+00:00 ― 6 leggere min

ResQ ottimizza i grandi modelli linguistici, migliorando le prestazioni e riducendo i costi.

2025-02-20T08:07:48+00:00 ― 6 leggere min