Jindong Gu

Un nouveau modèle améliore la précision de récupération pour les vidéos avec plusieurs événements.

2025-10-05T17:44:42+00:00 ― 7 min lire

Ce document étudie le risque d'attaques par porte dérobée dans l'apprentissage par quelques exemples.

2025-09-19T15:10:18+00:00 ― 9 min lire

Les modèles de fond comme CLIP offrent à la fois des opportunités et des dangers cachés dans l'IA.

2025-08-27T20:05:48+00:00 ― 8 min lire

Un nouveau cadre améliore la sécurité dans la création d'images à partir de descriptions textuelles.

2025-08-20T12:58:48+00:00 ― 8 min lire

Cet article parle d'un nouveau standard pour combiner des images et du texte afin de trouver des événements dans des vidéos.

2025-07-28T20:24:24+00:00 ― 11 min lire

Un nouveau référentiel évalue l'efficacité des modèles de langage dans les applications robotiques.

2025-07-22T16:56:24+00:00 ― 8 min lire

Une nouvelle méthode améliore la distillation de jeux de données, rendant l'entraînement des modèles plus efficace.

2025-07-10T06:11:18+00:00 ― 6 min lire

Cet article parle des problèmes de sécurité dans les modèles texte-à-image et propose des solutions.

2025-06-04T12:22:48+00:00 ― 8 min lire

Explorer des méthodes pour améliorer les modèles multimodaux dans l'analyse des questions visuelles.

2025-06-03T18:52:06+00:00 ― 8 min lire

Présentation d'un modèle qui déniche des moments précis dans de longues vidéos sans effort.

2025-05-12T10:45:20+00:00 ― 7 min lire