Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Apprentissage automatique# Robotique

Jeu de données ouvert Zenseact : Avancer les voitures autonomes

Un jeu de données varié qui soutient la croissance de la technologie des voitures autonomes.

― 7 min lire


ZOD : Un jeu de donnéesZOD : Un jeu de donnéespour la conduite autonometechnologie de conduite autonome.Des avancées puissantes dans la
Table des matières

Ces dernières années, on a beaucoup parlé du développement des voitures autonomes. Ces véhicules pourraient améliorer la sécurité routière et réduire les accidents. Mais pour bien fonctionner, ils ont besoin d'une tonne d'infos sur leur environnement. Ça nécessite un dataset solide qui montre différentes conditions et situations de conduite. Beaucoup de datasets existants manquent de variété, se concentrant souvent sur des environnements et scénarios spécifiques. Ça limite l'efficacité de la technologie dans le monde réel.

Pour combler ce manque, un nouveau dataset appelé Zenseact Open Dataset (ZOD) a été créé. Ce dataset est grand et diversifié, incluant différentes situations de conduite collectées pendant deux ans dans plusieurs régions d'Europe. En utilisant des capteurs de haute qualité, ZOD fournit des infos détaillées sur l'environnement où un véhicule opère, ainsi que sur diverses conditions de conduite.

C'est quoi ZOD ?

ZOD est un dataset complet destiné à soutenir le développement de la technologie de conduite autonome. Il couvre un large éventail de scènes de trafic, des zones urbaines aux autoroutes, dans différentes conditions météorologiques et d'éclairage. Le dataset est divisé en trois catégories principales : Frames, Sequences et Drives. Chaque catégorie est conçue pour des tâches de recherche différentes et aide les chercheurs à développer de meilleurs algorithmes pour la conduite automatisée.

  • Frames : Le dataset comprend 100 000 frames indépendantes. Chaque frame contient des images et des données de capteurs à un moment précis, ce qui facilite le travail des chercheurs sur des tâches non temporelles.

  • Sequences : Il y a 1 473 Séquences de 20 secondes chacune. Celles-ci sont destinées aux applications qui nécessitent de comprendre les changements dans le temps, comme estimer la trajectoire d'un véhicule.

  • Drives : Le dataset se compose de 29 drives de plusieurs minutes. Cette catégorie montre divers scénarios de conduite, y compris des courbes, des intersections et d'autres caractéristiques routières.

Importance de la diversité

Un des plus gros avantages de ZOD, c'est sa diversité, super importante pour former des voitures autonomes efficaces. Les données ont été collectées dans 14 pays européens. Cette variété géographique fait que le dataset capte différentes conditions météorologiques et routières, essentielles pour tester les algorithmes de conduite autonome dans des situations réelles.

Le dataset propose des scènes allant des routes enneigées en Suède aux rues ensoleillées en Italie. En montrant comment les véhicules peuvent gérer différents environnements, ZOD permet aux chercheurs de créer des modèles capables de s'adapter à divers motifs et conditions climatiques.

Capteurs haute qualité

Une des raisons pour lesquelles ZOD se démarque des autres datasets, c'est l'utilisation de capteurs de haute qualité. Le dataset inclut des images capturées avec une caméra de 8 mégapixels, des systèmes LIDAR et des données GNSS/IMU précises. Ces capteurs fournissent des images haute résolution et des infos de positionnement précises, essentielles pour naviguer en toute sécurité dans des scénarios de conduite complexes.

Le système LIDAR permet de détecter des objets jusqu'à 245 mètres, ce qui est plus loin que ce que la plupart des datasets disponibles peuvent atteindre. Des capteurs haute résolution aident les chercheurs à mieux comprendre comment les véhicules perçoivent leur environnement, surtout à grande vitesse.

Annotations complètes

Les annotations sont essentielles pour un dataset car elles fournissent des infos cruciales sur ce qui se passe dans chaque frame. ZOD inclut un ensemble détaillé d'annotations pour différentes tâches :

  • Segmentation sémantique : Ça aide à identifier et classifier différentes parties de l'image, comme les voies, les trottoirs et les véhicules.

  • Boîtes englobantes 2D/3D : Elles sont utilisées pour marquer les positions et tailles des objets dans les espaces 2D et 3D.

  • Panneaux de signalisation : ZOD possède une classification étendue des panneaux de signalisation, avec 446 000 instances uniques à travers 156 classes. Cet ensemble riche d'annotations est vital pour entraîner des modèles qui doivent reconnaître et réagir aux panneaux de signalisation.

En incluant des annotations complètes, ZOD propose une excellente ressource pour l'apprentissage multitâche, permettant aux modèles d'apprendre de plusieurs tâches en même temps. Ça peut mener à de meilleures performances sur des tâches individuelles.

Applications en sécurité routière

Le but ultime du Zenseact Open Dataset est de contribuer aux avancées en matière de sécurité routière grâce à la technologie de conduite automatisée. Les accidents de la route provoquent plus de 1,3 million de décès dans le monde chaque année. Les véhicules autonomes pourraient potentiellement réduire ces chiffres en reconnaissant les situations dangereuses et en prenant des décisions rapides.

Avec un dataset comme ZOD, les développeurs peuvent créer des algorithmes qui non seulement reconnaissent les panneaux de signalisation, mais ajustent aussi leur comportement selon différents scénarios de conduite. Cette capacité est essentielle pour rendre les voitures autonomes fiables et efficaces dans des conditions réelles.

Prendre en compte les préoccupations de confidentialité

La confidentialité est un aspect crucial de tout dataset qui implique des images du monde réel. Pour protéger la vie privée des gens en utilisant ZOD, des mesures spécifiques ont été prises pour anonymiser les visages et les plaques d'immatriculation. Des flous et des remplacements synthétiques sont utilisés pour s'assurer que les infos personnelles ne soient pas révélées.

Ces techniques d'anonymisation permettent aux chercheurs d'étudier l'impact de la protection de la vie privée sans compromettre la qualité des données. Cette approche est d'autant plus importante vu les réglementations strictes sur la vie privée en place, comme le Règlement général sur la protection des données (RGPD) en Europe.

Avantages par rapport aux autres datasets

ZOD offre des avantages significatifs comparés aux datasets existants pour la conduite autonome. Beaucoup de datasets se concentrent uniquement sur des zones ou situations spécifiques, ce qui peut limiter leur efficacité. À l'inverse, ZOD couvre un plus large éventail d'environnements et de conditions de conduite.

Certains datasets notables, comme KITTI et NuScenes, ont contribué au développement de la technologie de conduite automatisée. Cependant, ils échouent souvent à capturer le même niveau de diversité géographique et situationnelle. ZOD répond à ces limitations, en faisant une ressource plus complète pour les chercheurs.

De plus, ZOD est le premier dataset à grande échelle publié sous une licence permissive, qui permet une utilisation à la fois pour la recherche et le commerce. Cette flexibilité incite les startups et les entreprises à utiliser le dataset pour leurs projets, favorisant ainsi l'innovation dans le domaine.

Conclusion

Le Zenseact Open Dataset est une ressource essentielle pour faire avancer les technologies de conduite autonome. En offrant un dataset large et diversifié, qui inclut des données de capteurs de haute qualité et des annotations détaillées, ZOD permet aux chercheurs et développeurs de créer des algorithmes plus robustes et adaptables.

Grâce à la couverture extensive de diverses conditions de conduite à travers l'Europe, le dataset sert de modèle pour construire des systèmes capables d'opérer en toute sécurité et efficacement dans des scénarios réels. Avec un œil sur l'avenir, ZOD vise à inspirer des innovations qui améliorent la sécurité routière et réduisent les accidents à l'échelle mondiale.

Dans l'ensemble, ZOD représente une avancée précieuse dans le développement de la conduite automatisée et pave la voie pour un système de transport plus sûr et plus efficace.

Source originale

Titre: Zenseact Open Dataset: A large-scale and diverse multimodal dataset for autonomous driving

Résumé: Existing datasets for autonomous driving (AD) often lack diversity and long-range capabilities, focusing instead on 360{\deg} perception and temporal reasoning. To address this gap, we introduce Zenseact Open Dataset (ZOD), a large-scale and diverse multimodal dataset collected over two years in various European countries, covering an area 9x that of existing datasets. ZOD boasts the highest range and resolution sensors among comparable datasets, coupled with detailed keyframe annotations for 2D and 3D objects (up to 245m), road instance/semantic segmentation, traffic sign recognition, and road classification. We believe that this unique combination will facilitate breakthroughs in long-range perception and multi-task learning. The dataset is composed of Frames, Sequences, and Drives, designed to encompass both data diversity and support for spatio-temporal learning, sensor fusion, localization, and mapping. Frames consist of 100k curated camera images with two seconds of other supporting sensor data, while the 1473 Sequences and 29 Drives include the entire sensor suite for 20 seconds and a few minutes, respectively. ZOD is the only large-scale AD dataset released under a permissive license, allowing for both research and commercial use. More information, and an extensive devkit, can be found at https://zod.zenseact.com

Auteurs: Mina Alibeigi, William Ljungbergh, Adam Tonderski, Georg Hess, Adam Lilja, Carl Lindstrom, Daria Motorniuk, Junsheng Fu, Jenny Widahl, Christoffer Petersson

Dernière mise à jour: 2023-10-21 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2305.02008

Source PDF: https://arxiv.org/pdf/2305.02008

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires