Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.
― 8 min lire
La science de pointe expliquée simplement
Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.
― 8 min lire
Un nouveau cadre améliore la compréhension de l'IA des espaces 3D.
― 9 min lire
Une nouvelle technique améliore la génération de texte dans le traitement du langage naturel.
― 8 min lire
Un nouveau modèle simplifie la création d'images et de vidéos AI avec une meilleure vitesse et qualité.
― 6 min lire
UniZero améliore la mémoire à long terme et les capacités de prise de décision de l'IA.
― 8 min lire
MM-Instruct améliore la capacité des grands modèles multimodaux à suivre des instructions diverses.
― 7 min lire
Une nouvelle approche améliore le raisonnement dans les modèles de langage en générant des erreurs contrôlées.
― 9 min lire
Le dataset AMEX améliore la compréhension de l'IA sur les interfaces d'applications mobiles.
― 9 min lire
Un nouveau modèle révolutionne la génération d'images à partir de descriptions textuelles, améliorant divers secteurs.
― 7 min lire
Une nouvelle méthode génère des avatars 3D personnalisables à partir de descriptions textuelles.
― 9 min lire
LLaVA-MoD crée des modèles multimodaux plus petits en utilisant le savoir de leurs grands equivalents.
― 7 min lire
Examiner le rôle des LMM dans la transformation des capacités de recherche avec du texte et des images.
― 8 min lire
MedViLaM intègre plusieurs types de données médicales pour une meilleure analyse et prise de décision.
― 7 min lire
Vivez le vieillissement en 3D avec la technologie TimeWalker !
― 6 min lire
StreamChat change la façon dont on interagit avec les vidéos en streaming en temps réel.
― 8 min lire