Simple Science

La science de pointe expliquée simplement

# Informatique# Robotique# Vision par ordinateur et reconnaissance des formes

ObVi-SLAM : Avancées dans la localisation des robots

ObVi-SLAM améliore la localisation des robots en combinant des caractéristiques visuelles et la détection d'objets.

― 10 min lire


ObVi-SLAM révolutionne laObVi-SLAM révolutionne lanavigation des robotsdes robots.efficacement le suivi de la positionUne nouvelle méthode améliore
Table des matières

Ces dernières années, les robots ont pris de plus en plus d'importance pour diverses tâches, en particulier celles qui nécessitent de longues périodes de fonctionnement. Ces robots doivent déterminer de manière fiable leur position dans le temps et maintenir une carte de leur environnement, même quand les conditions changent. Les méthodes traditionnelles utilisant des informations visuelles rencontrent souvent des difficultés avec ces défis, surtout face aux variations d'éclairage, aux angles de vue et à l'environnement lui-même. Pour remédier à ces problèmes, une nouvelle méthode appelée ObVi-SLAM a été développée pour améliorer la façon dont les robots peuvent se localiser et suivre leur environnement.

Le Problème

Quand les robots effectuent des tâches pendant longtemps, ils rencontrent plein de galères. Par exemple, l'environnement peut changer à cause d'objets mobiles, de variations d'éclairage et de différents angles de vue. Les méthodes existantes basées sur des infos visuelles dépendent souvent de caractéristiques spécifiques dans l'environnement, comme des points sur les murs ou les sols, qui peuvent ne pas être fiables dans le temps. Du coup, à mesure que le robot opère, les cartes qu'ils créent peuvent devenir trop grandes et difficiles à gérer.

Une partie importante de ce souci est que de nombreux systèmes traditionnels se concentrent surtout sur des opérations à court terme. Ils se basent souvent sur la reconnaissance d'objets proches, ce qui limite leur capacité à s'adapter à la nature dynamique du monde réel. En revanche, la technologie de Détection d'objets a beaucoup évolué et propose une manière plus robuste d'identifier et de suivre les caractéristiques importantes d'une scène. Cette technologie peut offrir une image plus claire de l'environnement en se concentrant sur des objets qui restent en place plutôt que sur des caractéristiques qui changent fréquemment.

Présentation d'ObVi-SLAM

ObVi-SLAM vise à tirer parti des forces à la fois des méthodes visuelles traditionnelles et de la technologie moderne de détection d'objets. La clé de sa conception est l'intégration de deux approches pour assurer à la fois une précision à court terme et une stabilité à long terme. Cette méthode combine des caractéristiques visuelles de bas niveau avec la détection d'objets pour créer un système robuste capable de s'adapter à diverses conditions sur de longues périodes.

Comment ObVi-SLAM fonctionne

ObVi-SLAM fonctionne en deux phases principales : la phase SLAM (Localisation et Cartographie Simultanées) et la phase d'extraction de carte à long terme.

  1. Phase SLAM : Pendant cette phase, alors que le robot se déplace activement, il collecte des informations visuelles et détecte des objets dans son environnement. Le robot estime ses mouvements et met à jour sa carte en temps réel. En combinant des caractéristiques visuelles de bas niveau et des objets détectés, il crée une représentation précise de son environnement.

  2. Phase d'Extraction de Carte à Long Terme : Après avoir terminé une session de déploiement, le système affine les données collectées et construit une carte complète à long terme. Cette carte se concentre sur les objets statiques dans l'environnement tout en incorporant des estimations d'incertitude pour s'adapter aux changements au fil du temps.

En utilisant la technologie de détection d'objets, ObVi-SLAM peut maintenir une représentation précise et plus petite de l'environnement. Cette méthode permet un stockage et un traitement plus efficaces, rendant la gestion plus facile sur de longues périodes.

Avantages de l'utilisation des objets

Un des principaux avantages d'ObVi-SLAM est sa capacité à maintenir une localisation cohérente sur de longues périodes, même avec des variations d'éclairage et de points de vue. Les objets dans l'environnement restent un point crucial d'attention. Voici pourquoi :

  • Robustesse aux Changements : Les systèmes de détection d'objets sont généralement conçus pour résister aux variations d'apparence. En conséquence, ils peuvent identifier et suivre les objets avec confiance, même en cas de changements d'éclairage ou de points de vue.

  • Cartographie Compacte : La cartographie basée sur les objets est généralement plus compacte que les cartes basées sur les caractéristiques traditionnelles. Plutôt que de dépendre de nombreuses caractéristiques visuelles, elle regroupe des données sur des objets identifiables, conduisant à des cartes plus petites et plus faciles à gérer.

  • Amélioration Continue : La carte à long terme créée par ObVi-SLAM peut être mise à jour en permanence grâce à de nouvelles observations de chaque session. Cela signifie que la carte deviendra plus précise au fur et à mesure que de nouvelles données seront collectées, tout en restant capable de s'adapter aux changements de l'environnement.

Travaux Connexes

De nombreuses méthodes ont essayé de relever des défis similaires en localisation et cartographie. Certaines premières efforts utilisaient des modèles préexistants pour cartographier les environnements, mais ces systèmes étaient souvent limités dans leurs capacités.

Des systèmes plus récents se sont concentrés sur l'amélioration de la représentation des objets, par exemple en utilisant des cuboïdes ou des ellipsoïdes pour les objets. Ces modèles ont amélioré la compréhension des relations spatiales mais ont toujours eu du mal avec des déploiements à long terme. Certains systèmes ont même introduit des mesures pour détecter les changements dans l'environnement, mais ils ne prenaient souvent pas en compte la complexité qui découle d'une opération prolongée du robot.

L'introduction d'approches SLAM basées sur les objets a apporté des améliorations, mais beaucoup de ces systèmes continuent à se concentrer sur des applications intérieures à court terme. ObVi-SLAM se démarque parce qu'il est spécifiquement conçu pour des opérations extérieures à long terme, comblant ainsi une lacune que les systèmes précédents ont négligée.

L'approche ObVi-SLAM

ObVi-SLAM repose sur deux types d'optimisation : l'ajustement local et l'ajustement global. Chacun de ces aspects joue un rôle essentiel pour garantir une localisation précise et à long terme.

Ajustement Local

Dans l'ajustement local, le système se concentre sur les poses les plus récentes et les observations correspondantes. Cette méthode permet d'obtenir des estimations de l'odométrie visuelle de haute qualité, c'est-à-dire qu'elle peut suivre avec précision où se dirige le robot à chaque instant.

Ajustement Global

Dans l'ajustement global, le système réévalue les estimations faites par l'ajustement local tout en tenant compte des données de toute la trajectoire parcourue par le robot. Cette méthode permet d'améliorer la précision globale en incorporant une plus grande variété d'informations plutôt que de se limiter aux données les plus récentes.

Évaluation d'ObVi-SLAM

Pour confirmer l'efficacité d'ObVi-SLAM, les chercheurs l'ont évalué lors de diverses sessions de déploiement ayant lieu sous différentes conditions météorologiques et d'éclairage. Ce test empirique visait à montrer la précision des estimations de localisation tout en évaluant la robustesse du système dans des circonstances variées.

Collecte de Données

L'évaluation a consisté à recueillir des données lors de 16 sessions de déploiement différentes sur une période de deux mois. Chaque session variait en éclairage et en conditions météorologiques pour tester la capacité du système à s'adapter à ces changements. Pendant ces sessions, le robot se déplaçait le long de chemins prédéfinis, s'arrêtant à des points spécifiques pour garantir la cohérence des mesures.

Métriques de Performance

Pour évaluer la performance d'ObVi-SLAM, les chercheurs ont pris en compte plusieurs métriques :

  • Précision de Trajectoire : Le système a été évalué sur sa capacité à estimer avec précision son chemin à travers l'environnement.

  • Cohérence de Localisation : Cela impliquait de mesurer à quel point les estimations de localisation étaient cohérentes par rapport à un cadre de référence global dans différentes conditions.

  • Estimation d'Objets : Les chercheurs ont voulu déterminer à quel point ObVi-SLAM pouvait identifier et localiser avec précision des objets dans l'environnement.

  • Efficacité de l'Espace Cartographique : La compacité des cartes créées par ObVi-SLAM a également été évaluée pour comprendre ses avantages par rapport aux méthodes traditionnelles.

Résultats

Les résultats de l'évaluation ont montré qu'ObVi-SLAM était exceptionnellement performant par rapport à d'autres méthodes existantes. Il a maintenu une forte précision de trajectoire, estimé la localisation de manière cohérente et identifié efficacement des objets dans l'environnement.

Précision de Translation et d'Orientation

Pour ce qui est de la précision de translation et d'orientation, la performance d'ObVi-SLAM est restée compétitive, affichant moins de 8 degrés d'erreur de rotation en moyenne sur toutes les trajectoires. Cette amélioration marquée a prouvé que le système pouvait suivre de manière fiable sa position sur de longues distances et périodes.

Cohérence sous Changements

La capacité à générer des estimations cohérentes parmi six points différents à travers les 16 trajectoires était un indicateur crucial de performance. Les résultats ont montré qu'ObVi-SLAM pouvait maintenir une forte cohérence en localisation, ce qui est vital pour des opérations autonomes.

Métriques d'Estimation d'Objets

En termes d'estimation d'objets, ObVi-SLAM a affiché une précision supérieure par rapport à ses concurrents. Il a produit de meilleures estimations des positions et des volumes des objets tout en minimisant l'apparition de doublons. Notamment, il a atteint de forts taux de rappel, identifiant avec succès un plus grand nombre d'objets dans l'environnement.

Efficacité de l'Espace

Un autre avantage significatif d'ObVi-SLAM était sa capacité à créer des cartes efficaces en termes d'espace. La taille comprimée des cartes générées par le système était de plusieurs ordres de grandeur plus petite que celles produites par les approches de cartographie visuelle traditionnelles. Cette amélioration se traduit par des besoins de stockage réduits et une meilleure gestion des données cartographiques.

Conclusion

ObVi-SLAM représente une avancée notable dans le domaine du SLAM visuel et de la localisation à long terme pour les robots. En combinant des caractéristiques visuelles de bas niveau et une détection d'objets robuste, il aborde des défis critiques rencontrés par les méthodes existantes et offre de meilleures performances sur de longues périodes. Sa capacité à s'adapter aux changements dans l'environnement tout en maintenant une haute précision en fait un outil important pour les robots de service mobiles et autres systèmes autonomes.

Travaux Futurs

Pour l'avenir, il existe plusieurs pistes à explorer pour améliorer les capacités d'ObVi-SLAM :

  • Descripteurs d'Objets Basés sur l'Apprentissage : Développer un système basé sur l'apprentissage qui crée des descripteurs d'apparence à long terme pour les objets pourrait améliorer considérablement la précision des associations d'objets dans le temps.

  • Détection de Changements d'Objets : Intégrer des méthodes pour détecter les changements dans les objets pourrait aider à gérer les informations obsolètes, améliorant ainsi l'efficacité du système.

  • Modèles de Facteurs Complexes : Explorer des modèles plus complexes pour la carte à long terme pourrait permettre une meilleure représentation des incertitudes d'objets et de leurs relations.

  • Fermeture de Boucle et Localisation Initiale : Étendre ObVi-SLAM pour incorporer des techniques de fermeture de boucle ou de localisation initiale basée sur la carte à long terme pourrait encore améliorer ses capacités, permettant une meilleure navigation et cartographie dans des environnements complexes.

En s'attaquant à ces améliorations potentielles, les développements futurs peuvent rendre ObVi-SLAM un outil encore plus efficace pour les robots autonomes naviguant dans des environnements dynamiques et changeants.

Source originale

Titre: ObVi-SLAM: Long-Term Object-Visual SLAM

Résumé: Robots responsible for tasks over long time scales must be able to localize consistently and scalably amid geometric, viewpoint, and appearance changes. Existing visual SLAM approaches rely on low-level feature descriptors that are not robust to such environmental changes and result in large map sizes that scale poorly over long-term deployments. In contrast, object detections are robust to environmental variations and lead to more compact representations, but most object-based SLAM systems target short-term indoor deployments with close objects. In this paper, we introduce ObVi-SLAM to overcome these challenges by leveraging the best of both approaches. ObVi-SLAM uses low-level visual features for high-quality short-term visual odometry; and to ensure global, long-term consistency, ObVi-SLAM builds an uncertainty-aware long-term map of persistent objects and updates it after every deployment. By evaluating ObVi-SLAM on data from 16 deployment sessions spanning different weather and lighting conditions, we empirically show that ObVi-SLAM generates accurate localization estimates consistent over long-time scales in spite of varying appearance conditions.

Auteurs: Amanda Adkins, Taijing Chen, Joydeep Biswas

Dernière mise à jour: 2023-10-22 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.15268

Source PDF: https://arxiv.org/pdf/2309.15268

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires