Un nouveau modèle améliore la précision de récupération pour les vidéos avec plusieurs événements.
― 7 min lire
La science de pointe expliquée simplement
Un nouveau modèle améliore la précision de récupération pour les vidéos avec plusieurs événements.
― 7 min lire
Ce document étudie le risque d'attaques par porte dérobée dans l'apprentissage par quelques exemples.
― 9 min lire
Les modèles de fond comme CLIP offrent à la fois des opportunités et des dangers cachés dans l'IA.
― 8 min lire
Un nouveau cadre améliore la sécurité dans la création d'images à partir de descriptions textuelles.
― 8 min lire
Cet article parle d'un nouveau standard pour combiner des images et du texte afin de trouver des événements dans des vidéos.
― 11 min lire
Un nouveau référentiel évalue l'efficacité des modèles de langage dans les applications robotiques.
― 8 min lire
Une nouvelle méthode améliore la distillation de jeux de données, rendant l'entraînement des modèles plus efficace.
― 6 min lire
Cet article parle des problèmes de sécurité dans les modèles texte-à-image et propose des solutions.
― 8 min lire
Explorer des méthodes pour améliorer les modèles multimodaux dans l'analyse des questions visuelles.
― 8 min lire
Présentation d'un modèle qui déniche des moments précis dans de longues vidéos sans effort.
― 7 min lire