Un nouveau système améliore la détection d'action vidéo en utilisant des Modèles de Langage Multimodaux de Grande Taille.
Quan Zhang, Yuxin Qi
― 8 min lire
La science de pointe expliquée simplement
Un nouveau système améliore la détection d'action vidéo en utilisant des Modèles de Langage Multimodaux de Grande Taille.
Quan Zhang, Yuxin Qi
― 8 min lire