CLIP gère bien le déséquilibre des données dans les tâches visuelles et linguistiques.
― 9 min lire
La science de pointe expliquée simplement
CLIP gère bien le déséquilibre des données dans les tâches visuelles et linguistiques.
― 9 min lire
MMScan améliore la capacité de l'IA à comprendre des environnements 3D complexes avec des annotations détaillées.
― 9 min lire
Une nouvelle méthode aide les robots à porter des objets ensemble.
― 8 min lire
OVExp combine le langage et la vision pour une navigation efficace des objets dans des environnements variés.
― 7 min lire
LLaVA-3D mélange des infos 2D et 3D pour un raisonnement spatial plus poussé.
― 7 min lire
Un nouveau modèle aide les robots à mixer vision et action pour de meilleures compétences de manipulation.
― 6 min lire