BlackMamba combine des modèles d'état et un mélange d'experts pour des tâches de langue efficaces.
― 8 min lire
La science de pointe expliquée simplement
BlackMamba combine des modèles d'état et un mélange d'experts pour des tâches de langue efficaces.
― 8 min lire
Zamba est un modèle de langage hybride qui combine des architectures d'espace d'état et de transformateur.
― 8 min lire
Zyda, un jeu de données avec 1,3 trillion de tokens, améliore l'entraînement des modèles de langue.
― 8 min lire
Un aperçu de la diffusion à travers des modèles de gaz de réseau et des effets non linéaires.
― 10 min lire