LLaVA-MoD crée des modèles multimodaux plus petits en utilisant le savoir de leurs grands equivalents.
― 7 min lire
La science de pointe expliquée simplement
LLaVA-MoD crée des modèles multimodaux plus petits en utilisant le savoir de leurs grands equivalents.
― 7 min lire
Un nouveau jeu de données qui améliore la compréhension vidéo et le raisonnement de l'IA.
― 7 min lire