Mubarak Shah

Examiner des modèles de base qui combinent vision et langage pour des applications variées.

2025-10-16T00:53:00+00:00 ― 7 min lire

De nouvelles techniques améliorent la fiabilité des outils d'imagerie médicale face aux altérations de données nuisibles.

2025-10-09T00:48:55+00:00 ― 6 min lire

De nouvelles méthodes améliorent la compréhension des différents types de données.

2025-10-04T23:42:24+00:00 ― 7 min lire

Une nouvelle méthode améliore la précision de la reconnaissance d'actions avec peu d'exemples sur différents types de données.

2025-09-29T12:34:00+00:00 ― 8 min lire

Combiner les données RGB et profondeur améliore la reconnaissance d'actions dans les systèmes robotiques.

2025-09-04T06:48:05+00:00 ― 8 min lire

FSViewFusion génère des vues 3D réalistes à partir d'images limitées de manière efficace.

2025-08-30T22:05:36+00:00 ― 7 min lire

Un nouveau cadre améliore les recherches vidéo en combinant des visuels et des descriptions détaillées en langage.

2025-08-26T00:23:00+00:00 ― 8 min lire

Un nouveau cadre améliore l'explicabilité dans les systèmes d'apprentissage profond.

2025-08-22T20:08:54+00:00 ― 8 min lire

Une nouvelle approche pour détecter le cancer du poumon tôt grâce à l'analyse d'images automatisée.

2025-07-24T03:27:30+00:00 ― 8 min lire

X-Former améliore comment les modèles combinent la compréhension des images et des textes.

2025-07-11T06:40:42+00:00 ― 11 min lire

FinePseudo améliore la reconnaissance d'actions fine avec moins d'exemples étiquetés.

2025-06-18T14:45:48+00:00 ― 9 min lire

Une nouvelle méthode améliore l'alignement des vidéos dans de grands ensembles de données.

2025-06-18T14:30:00+00:00 ― 11 min lire

Une nouvelle méthode aide les robots à accomplir des tâches plus efficacement en décomposant les objectifs.

2025-06-01T13:48:24+00:00 ― 6 min lire

Un nouveau cadre améliore l'identification en générant des images de vêtements variés.

2025-05-25T21:24:45+00:00 ― 8 min lire