Jiangmiao Pang

Un nouveau cadre améliore les interactions humain-objet grâce à des commandes en langage simple.

2025-09-27T01:11:06+00:00 ― 6 min lire

CLIP gère bien le déséquilibre des données dans les tâches visuelles et linguistiques.

2025-08-04T02:14:36+00:00 ― 9 min lire

MMScan améliore la capacité de l'IA à comprendre des environnements 3D complexes avec des annotations détaillées.

2025-07-29T11:32:54+00:00 ― 9 min lire

Une nouvelle méthode aide les robots à porter des objets ensemble.

2025-07-26T00:51:42+00:00 ― 8 min lire

OVExp combine le langage et la vision pour une navigation efficace des objets dans des environnements variés.

2025-07-14T06:34:06+00:00 ― 7 min lire

LLaVA-3D mélange des infos 2D et 3D pour un raisonnement spatial plus poussé.

2025-06-05T06:01:24+00:00 ― 7 min lire

Un nouveau modèle aide les robots à mixer vision et action pour de meilleures compétences de manipulation.

2025-02-13T05:11:51+00:00 ― 6 min lire