Utkarsh Saxena

Die Kombination von SmoothQuant und GPTQ verbessert die Effizienz und Leistung grosser Sprachmodelle.

2025-08-11T22:23:42+00:00 ― 6 min Lesedauer

Eigen Attention verbessert die Speichereffizienz für grosse Sprachmodelle, die lange Texte verarbeiten.

2025-06-29T16:43:48+00:00 ― 6 min Lesedauer

ResQ optimiert grosse Sprachmodelle, verbessert die Leistung und senkt die Kosten.

2025-02-20T08:07:48+00:00 ― 6 min Lesedauer