Cihang Xie

Nouveau benchmark évalue comment les modèles vidéo-langue gèrent efficacement les inexactitudes.

2025-07-24T17:47:18+00:00 ― 8 min lire

Un modèle qui améliore la segmentation des pièces et des objets dans les images.

2025-06-18T12:55:12+00:00 ― 7 min lire

Un cadre utilisant des jetons de mémoire améliore la compréhension et l'interaction vidéo.

2025-06-18T08:10:48+00:00 ― 9 min lire