De nouvelles méthodes améliorent la performance des modèles de langue en optimisant l'utilisation de la mémoire.
― 7 min lire
La science de pointe expliquée simplement
De nouvelles méthodes améliorent la performance des modèles de langue en optimisant l'utilisation de la mémoire.
― 7 min lire
Combiner SmoothQuant et GPTQ améliore l'efficacité et la performance des grands modèles de langage.
― 7 min lire