A-BDD : Faire avancer la tech des voitures autonomes
A-BDD améliore l'entraînement ML pour les voitures autonomes par mauvais temps.
Felix Assion, Florens Gressner, Nitin Augustine, Jona Klemenc, Ahmed Hammam, Alexandre Krattinger, Holger Trittenbach, Anja Philippsen, Sascha Riemer
― 8 min lire
Table des matières
Les voitures autonomes dépendent de programmes informatiques appelés Apprentissage automatique (ML) pour voir et comprendre leur environnement. Même si ces programmes marchent bien par beau temps, ils galèrent pas mal quand il pleut, qu'il neige ou qu'il y a trop de lumière ou d'obscurité. Pour résoudre ce problème, les ingénieurs en ML ont généralement besoin de pas mal d'exemples réels pour entraîner leurs programmes. Mais rassembler suffisamment de données de situations réelles, surtout celles difficiles, peut être super compliqué. C'est pour ça que des Données synthétiques (générées par ordinateur) peuvent être nécessaires pour aider à entraîner et tester ces systèmes en toute sécurité.
On vous présente A-BDD, un nouveau jeu de données qui contient un grand nombre d'images créées en modifiant un autre jeu de données appelé BDD100K. Ce jeu a plus de 10 000 images qui ont été modifiées pour montrer différentes conditions météorologiques difficiles comme la pluie, le brouillard et un soleil éclatant. Chaque image modifiée a des étiquettes qui aident les programmes ML à apprendre où se trouvent les différents objets dans l'image.
On a aussi créé de nouvelles façons de mesurer la qualité de ces images en utilisant des outils qui comparent des photos réelles avec nos images modifiées. En testant A-BDD, on montre que l'utilisation de ces images modifiées peut aider à réduire l'écart sur la façon dont les voitures autonomes peuvent voir et réagir pendant des conditions météorologiques difficiles.
Le défi des voitures autonomes
Créer des voitures autonomes, surtout celles qui peuvent rouler sans aucune aide humaine, repose beaucoup sur la création de solides programmes ML qui peuvent voir le monde autour d'eux. Des rapports récents montrent que beaucoup de problèmes avec les voitures autonomes viennent de leur incapacité à bien voir dans des conditions difficiles. Au fil des ans, les développeurs ont essayé de corriger ces problèmes en utilisant des images plus diverses pour entraîner les systèmes ML.
Cependant, beaucoup de jeux de données existants n'ont pas assez d'exemples de situations difficiles. Les méthodes de collecte de données échouent souvent à capturer des événements rares comme des intempéries parce que c'est difficile de contrôler les conditions autour de la voiture pendant qu'elle roule.
Ces défis font que les chercheurs se tournent souvent vers des données synthétiques pour entraîner et tester leurs programmes ML. Les données synthétiques complètes, créées avec des logiciels de simulation, sont maintenant une partie clé du testing de la technologie des voitures autonomes. On s'attend à ce que l'utilisation de ces données synthétiques continue de croître à l'avenir. Mais prouver que ces données synthétiques représentent fidèlement des conditions réelles reste encore compliqué. Des méthodes de test robustes et des preuves claires sont nécessaires pour démontrer que les données synthétiques peuvent correspondre à des scénarios du monde réel.
Qu'est-ce que A-BDD ?
A-BDD est une grande collection de plus de 10 000 images modifiées basées sur le jeu de données BDD100K qui montre différentes conditions météorologiques. Cette collection inclut des images qui simulent la pluie, le brouillard et le ciel couvert, accompagnées d’annotations pour l’entraînement en machine learning.
L'objectif principal de A-BDD est de fournir des images qui aident la technologie des voitures autonomes à améliorer sa capacité à reconnaître des objets même quand le temps est pourri. Le jeu de données inclut différents niveaux de gravité pour chaque condition météorologique afin de donner plus d'options aux développeurs lors de l'entraînement de leurs systèmes ML.
L'importance de l'augmentation des données
L'augmentation de données signifie prendre des images existantes et les modifier de manière à aider les systèmes ML à mieux apprendre. Par exemple, des modifications simples comme ajouter du bruit, faire pivoter des images ou les recadrer sont des pratiques courantes dans l'entraînement des modèles ML. Ces changements aident les modèles à se préparer à de nouvelles données qu'ils n'ont pas encore vues.
Dans le monde des voitures autonomes, créer des Données augmentées plus complexes qui ressemblent à des conditions réelles difficiles est encore nouveau. Beaucoup de chercheurs pensent que ces augmentations plus sophistiquées peuvent améliorer les performances des systèmes face à des situations difficiles, comme une forte pluie ou du brouillard. Cependant, beaucoup de développeurs n'ont pas encore totalement adopté ces techniques.
Aperçu du développement de A-BDD
La création de A-BDD a impliqué de prendre des images de base du jeu de données BDD100K, qui est l'un des plus grands et variés pour la technologie des voitures autonomes. Cependant, beaucoup de ses images ont été prises par beau temps, ce qui les rend moins utiles pour l'entraînement dans de mauvaises conditions.
Pour A-BDD, seules des images prises lors de journées claires ou couvertes ont été utilisées. Les images ont été soigneusement sélectionnées pour garantir qu'elles représentaient de bonnes données avant que l'augmentation ne soit appliquée. L'objectif était de conserver les détails importants dans chaque image tout en appliquant des effets météorologiques qui modifiaient la qualité visuelle sans nuire à la reconnaissance des objets.
Les images modifiées incluent des catégories comme :
- Nuageux : Images rendues plus nuageuses.
- Brouillard Dense : Images simulant le brouillard et réduisant la visibilité.
- Ombre et Éblouissement : Images montrant des effets de soleil et des ombres.
- Traînées de Pluie : Images ajoutant des traînées de pluie sur l'objectif.
- Rue Mouillée et Gouttes sur l'Objectif : Images montrant des reflets de rues mouillées et des gouttes sur l'objectif.
- Puddles : Images simulées de flaques sur les routes.
Les images augmentées ont été produites grâce à des méthodes personnalisées qui ont permis un contrôle et une précision, garantissant que les caractéristiques importantes des images originales restent intactes.
Évaluation de la qualité des images
Comprendre à quel point une image augmentée est bonne est important pour déterminer son utilité pour l'entraînement des systèmes ML. Pour mesurer la qualité des images, on a utilisé des métriques populaires connues sous le nom de FID (Fréchet Inception Distance) et CMMD (Maximum Mean Discrepancy). Ces métriques nous aident à comparer des images synthétiques avec de véritables images pour voir à quel point elles se ressemblent en termes de qualité et de détail.
Grâce à l'analyse, on a découvert que les images augmentées dans A-BDD ressemblent beaucoup aux images du monde réel, ce qui indique qu'elles peuvent réellement aider à améliorer les performances des systèmes de voitures autonomes dans des conditions difficiles.
Test de A-BDD
Dans nos expériences, on a testé A-BDD pour voir comment il performe dans différents scénarios. On a regardé :
- Similarité Visuelle : À quel point les images synthétiques ressemblent-elles aux images réelles ?
- Similarité Algorithmique : Les programmes ML reconnaissent-ils des caractéristiques similaires dans les images augmentées et réelles ?
- Amélioration de Performance : Utiliser ces images augmentées améliore-t-il les performances des systèmes ML dans la reconnaissance d'objets dans des conditions réelles ?
En utilisant un classificateur multi-météo entraîné avec des images du monde réel, on a testé à quel point le classificateur pouvait identifier les conditions météorologiques dans A-BDD. Le classificateur a pu reconnaître les caractéristiques météorologiques synthétiques, ce qui indique que les images augmentées étaient efficaces pour imiter des conditions réelles.
Amélioration de performance dans les tâches de segmentation
Enfin, on a exploré si entraîner des systèmes ML en utilisant A-BDD pouvait améliorer leurs performances face à des données du monde réel. Pour ce faire, on a affiné un Modèle de segmentation populaire avec des images de A-BDD et ensuite testé sa performance avec des données réelles d'un autre jeu de données appelé ACDC, qui contient des images montrant diverses conditions météorologiques.
Les résultats ont montré que les modèles entraînés avec A-BDD performaient mieux sur ces images réelles difficiles. De plus, on a identifié une relation claire entre la qualité des données augmentées et les performances des modèles ML lors de l'entraînement.
Conclusion
A-BDD représente un pas en avant considérable dans le développement d'une technologie de voitures autonomes robuste capable de gérer des conditions météorologiques difficiles. En utilisant des données augmentées, les développeurs peuvent améliorer leurs modèles ML et réduire les écarts de performance qui ont été observés dans le passé. Nos résultats soulignent l'importance d'utiliser des métriques de qualité pour sélectionner les meilleures données possibles pour l'entraînement, ce qui pourrait mener à des systèmes de voitures autonomes plus fiables à l'avenir.
En rendant ce jeu de données disponible au public, on espère encourager plus de recherches dans ce domaine et inspirer de nouvelles approches pour développer des véhicules autonomes plus sûrs.
Titre: A-BDD: Leveraging Data Augmentations for Safe Autonomous Driving in Adverse Weather and Lighting
Résumé: High-autonomy vehicle functions rely on machine learning (ML) algorithms to understand the environment. Despite displaying remarkable performance in fair weather scenarios, perception algorithms are heavily affected by adverse weather and lighting conditions. To overcome these difficulties, ML engineers mainly rely on comprehensive real-world datasets. However, the difficulties in real-world data collection for critical areas of the operational design domain (ODD) often means synthetic data is required for perception training and safety validation. Thus, we present A-BDD, a large set of over 60,000 synthetically augmented images based on BDD100K that are equipped with semantic segmentation and bounding box annotations (inherited from the BDD100K dataset). The dataset contains augmented data for rain, fog, overcast and sunglare/shadow with varying intensity levels. We further introduce novel strategies utilizing feature-based image quality metrics like FID and CMMD, which help identify useful augmented and real-world data for ML training and testing. By conducting experiments on A-BDD, we provide evidence that data augmentations can play a pivotal role in closing performance gaps in adverse weather and lighting conditions.
Auteurs: Felix Assion, Florens Gressner, Nitin Augustine, Jona Klemenc, Ahmed Hammam, Alexandre Krattinger, Holger Trittenbach, Anja Philippsen, Sascha Riemer
Dernière mise à jour: 2024-11-19 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2408.06071
Source PDF: https://arxiv.org/pdf/2408.06071
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.