Simple Science

La science de pointe expliquée simplement

# Informatique# Robotique# Vision par ordinateur et reconnaissance des formes

Avancées dans la navigation des robots avec vision stéréo

La vision stéréo améliore la navigation des robots, permettant une meilleure détection des obstacles.

Layth Hamad, Muhammad Asif Khan, Amr Mohamed

― 6 min lire


Vision stéréo : Un pas enVision stéréo : Un pas enavantprofondeur et des objets.grâce à une détection avancée de laAméliorer la navigation des robots
Table des matières

Les robots autonomes deviennent de plus en plus courants dans des domaines comme la fabrication, la santé, l'agriculture et la logistique. Une capacité clé dont ils ont besoin, c'est de voir et de comprendre leur environnement. Cette capacité est cruciale pour se déplacer en toute sécurité, éviter les obstacles et accomplir des tâches. Pour y parvenir, ces robots utilisent différents capteurs pour recueillir des informations sur leur environnement et ajuster leurs trajets selon les besoins.

Technologies de capteurs

Une technique populaire pour aider les robots à comprendre leur environnement s'appelle la Localisation et Cartographie Simultanées (SLAM). SLAM aide les robots à déterminer où ils se trouvent tout en créant une carte de leur environnement. Plusieurs capteurs peuvent être utilisés dans ce processus, y compris le LiDAR (Light Detection and Ranging), les caméras et les capteurs inertiels. Les systèmes LiDAR utilisent des lasers pour mesurer les distances et fournir des informations détaillées sur l'environnement. Cependant, bien que efficaces, les systèmes LiDAR présentent quelques défis. Par exemple, ils ont du mal à détecter les objets bas, les matériaux qui ne réfléchissent pas bien la lumière et les petits obstacles, surtout dans des environnements animés et changeants. En raison de ces limitations, les chercheurs cherchent d'autres options.

Les caméras, en particulier celles utilisant des techniques avancées comme la stéréo vision, deviennent de plus en plus populaires pour la navigation des robots. Elles sont rentables, faciles à installer et bénéficient de modèles de Détection d'objets prêts à l'emploi qui offrent une grande précision. La stéréo vision utilise deux caméras placées à une certaine distance l'une de l'autre, imitant les yeux humains, pour capturer la même scène. Cette configuration permet au robot de percevoir la profondeur-à quelle distance se trouvent les objets.

Le système proposé

Cet article présente une méthode qui utilise la stéréo vision pour mesurer la profondeur et la taille des objets, améliorant ainsi les capacités de navigation des robots autonomes. Dans ce système, le robot est équipé de deux caméras qui capturent des images de l'environnement en même temps. À l'aide de ces images, le robot détecte des objets et détermine à quelle distance ils se trouvent et quelle est leur taille dans le monde réel.

Détection d'objets

La première étape de ce système consiste à identifier les obstacles sur le chemin du robot en utilisant un modèle de détection d'objets. Le modèle analyse les images des deux caméras et fournit des prédictions qui incluent quels objets sont présents et où ils se trouvent dans les images. Cette étape est essentielle, car détecter les obstacles avec précision garantit que le robot peut naviguer en toute sécurité.

Estimation de la profondeur

L'étape suivante consiste à estimer à quelle distance se trouvent les objets détectés. Cette estimation de la profondeur est essentielle pour éviter les collisions et garantir une navigation sûre. Le système calcule les différences entre les positions du même objet dans les images capturées par les deux caméras. Ces différences aident le robot à comprendre à quelle distance un objet se trouve de lui.

Estimation de la taille

En plus de connaître la distance d'un objet, le robot doit également connaître la taille de l'objet pour naviguer efficacement autour. En utilisant les informations de profondeur ainsi que la taille de l'objet représenté dans les images, le système estime la taille réelle de l'objet dans le monde réel. Cette estimation implique l'utilisation d'un modèle mathématique qui aide à traduire la profondeur et les dimensions de l'image en mesures réelles.

Intégration avec SLAM

Une fois le système ayant estimé à la fois la profondeur et la taille des objets, il intègre ces informations dans le système SLAM. En représentant les objets sous forme de formes cylindriques, le robot peut placer ces objets avec précision dans sa carte interne. La hauteur de chaque cylindre correspond à la hauteur estimée de l'objet, tandis que sa largeur s'aligne avec la largeur estimée de l'objet. Cette représentation permet au robot d'éviter efficacement ces obstacles lors de sa navigation.

Pour s'assurer que le système fonctionne bien au sein du Robot Operating System (ROS), l'équipe a développé un capteur virtuel. Ce capteur partage en continu des informations sur les emplacements et tailles estimés des obstacles, permettant au robot de réagir rapidement en naviguant dans son environnement.

Tests et résultats

Le système proposé a été testé avec une variété d'objets dans différents scénarios. Le modèle de détection d'objets a été formé pour reconnaître des objets spécifiques avant d'être testé dans des environnements réels. Les résultats ont montré que le système pouvait détecter les obstacles avec précision, atteignant presque une précision parfaite dans leur détection. Le processus d'estimation de la profondeur a également produit des résultats fiables, ce qui signifie que le robot pouvait évaluer efficacement la distance des objets.

Dans la phase d'évaluation, les chercheurs ont comparé leur méthode avec celle des systèmes traditionnels s'appuyant sur le LiDAR. Bien que le LiDAR ait eu des difficultés à détecter certains objets, surtout ceux qui ne réfléchissaient pas bien la lumière, le système de stéréo vision s'est avéré plus efficace. Cette capacité à détecter une plus large gamme d'objets incluait ceux que le LiDAR manquait souvent, comme la fumée ou les objets transparents.

Défis et limitations

Bien que le système proposé ait montré de grandes promesses, il reste encore des défis à relever. L'approche basée sur les caméras peut avoir du mal dans des situations de faible éclairage ou de visibilité. Des conditions comme la pluie, le brouillard ou des obstacles bloquant les caméras peuvent nuire aux performances. De plus, les petits objets ou ceux très éloignés pourraient encore poser des difficultés pour la détection. Ces limitations sont similaires aux problèmes rencontrés par les systèmes de vision classiques et peuvent affecter l'efficacité générale dans certaines situations.

Conclusion

L'utilisation de la stéréo vision pour la détection d'obstacles et l'estimation de la profondeur a ouvert de nouvelles voies pour améliorer la navigation des robots autonomes. Ce système permet aux robots de mieux comprendre leur environnement, les rendant plus efficaces pour accomplir des tâches et éviter des obstacles. En combinant la force des modèles avancés de détection d'objets avec la stéréo vision, les robots peuvent devenir plus capables et fiables dans une variété d'applications. Des améliorations continues et des recherches viendront encore renforcer ces systèmes, ouvrant la voie à des robots autonomes plus sûrs et plus efficaces à l'avenir.

Source originale

Titre: Object Depth and Size Estimation using Stereo-vision and Integration with SLAM

Résumé: Autonomous robots use simultaneous localization and mapping (SLAM) for efficient and safe navigation in various environments. LiDAR sensors are integral in these systems for object identification and localization. However, LiDAR systems though effective in detecting solid objects (e.g., trash bin, bottle, etc.), encounter limitations in identifying semitransparent or non-tangible objects (e.g., fire, smoke, steam, etc.) due to poor reflecting characteristics. Additionally, LiDAR also fails to detect features such as navigation signs and often struggles to detect certain hazardous materials that lack a distinct surface for effective laser reflection. In this paper, we propose a highly accurate stereo-vision approach to complement LiDAR in autonomous robots. The system employs advanced stereo vision-based object detection to detect both tangible and non-tangible objects and then uses simple machine learning to precisely estimate the depth and size of the object. The depth and size information is then integrated into the SLAM process to enhance the robot's navigation capabilities in complex environments. Our evaluation, conducted on an autonomous robot equipped with LiDAR and stereo-vision systems demonstrates high accuracy in the estimation of an object's depth and size. A video illustration of the proposed scheme is available at: \url{https://www.youtube.com/watch?v=nusI6tA9eSk}.

Auteurs: Layth Hamad, Muhammad Asif Khan, Amr Mohamed

Dernière mise à jour: 2024-09-11 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2409.07623

Source PDF: https://arxiv.org/pdf/2409.07623

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires