Le Zhuo

DiffDance crée des séquences de danse détaillées qui s'accordent super bien avec la musique.

2025-09-29T16:31:20+00:00 ― 7 min lire

Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 8 min lire

Un nouveau modèle révolutionne la génération d'images à partir de descriptions textuelles, améliorant divers secteurs.

2025-07-02T04:22:30+00:00 ― 7 min lire

LLaVA-MoD crée des modèles multimodaux plus petits en utilisant le savoir de leurs grands equivalents.

2025-06-20T22:35:24+00:00 ― 7 min lire

Un nouveau jeu de données qui améliore la compréhension vidéo et le raisonnement de l'IA.

2025-05-12T04:00:00+00:00 ― 7 min lire