Xinhao Li

Nouveau jeu de données améliore les liens entre vidéo et texte pour la génération de contenu.

2025-10-20T16:55:54+00:00 ― 8 min lire

Un nouveau modèle améliore la compréhension des vidéos grâce à des techniques d'entraînement innovantes.

2025-08-26T20:39:36+00:00 ― 8 min lire

Cet article présente une nouvelle approche utilisant l'entraînement au moment du test pour améliorer les performances des RNN.

2025-07-18T17:28:54+00:00 ― 6 min lire

VideoEval établit une nouvelle référence pour évaluer efficacement les modèles de base vidéo.

2025-07-17T18:26:24+00:00 ― 7 min lire

OV-VSS révolutionne la façon dont les machines comprennent le contenu vidéo, identifiant de nouveaux objets sans effort.

2025-03-15T23:29:51+00:00 ― 10 min lire

Une nouvelle méthode améliore les performances des modèles de langage multimodal sur les tâches visuelles.

2025-01-24T20:33:00+00:00 ― 8 min lire