Une nouvelle méthode pour rendre les modèles de langage plus petits et plus rapides en utilisant la quantification à 1 bit.
― 9 min lire
La science de pointe expliquée simplement
Une nouvelle méthode pour rendre les modèles de langage plus petits et plus rapides en utilisant la quantification à 1 bit.
― 9 min lire