Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.
― 8 min lire
La science de pointe expliquée simplement
Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.
― 8 min lire
Un nouveau modèle révolutionne la génération d'images à partir de descriptions textuelles, améliorant divers secteurs.
― 7 min lire
LLaVA-MoD crée des modèles multimodaux plus petits en utilisant le savoir de leurs grands equivalents.
― 7 min lire
Un nouveau jeu de données qui améliore la compréhension vidéo et le raisonnement de l'IA.
― 7 min lire