Nouveau jeu de données met en lumière les défis des voitures autonomes par temps mauvais
SemanticSTF offre des données essentielles pour la reconnaissance d'objets dans des conditions météo difficiles.
― 8 min lire
Table des matières
- Le besoin de données sur le temps défavorable
- Aperçu de l'ensemble de données SemanticSTF
- Collecte et annotation des données
- Défis de l'annotation
- Résumé et statistiques des données
- Importance de l'adaptation et de la Généralisation de domaine
- PointDR : Une nouvelle approche
- Évaluation de la performance des modèles
- Remarques finales
- Directions futures
- Source originale
- Liens de référence
Ces dernières années, les voitures autonomes et les drones sont devenus de plus en plus courants. Ces véhicules doivent comprendre leur environnement pour fonctionner en toute sécurité. Une façon d'y parvenir est d'utiliser la technologie LiDAR, qui crée des cartes 3D détaillées de l'environnement. Cependant, la plupart des études et des ensembles de données se concentrent sur des conditions météorologiques normales. Que se passe-t-il quand il pleut, qu'il neige ou qu'il y a du brouillard ? La capacité de reconnaître et de catégoriser des objets dans de telles conditions est cruciale pour la sécurité.
Pour résoudre ce problème, un nouvel ensemble de données appelé SemanticSTF a été créé. Cet ensemble de données contient des données de nuage de points collectées dans des conditions météorologiques défavorables comme la neige, la pluie et le brouillard. Il a des annotations détaillées pour aider les chercheurs à construire des modèles capables de reconnaître des objets même par mauvais temps.
Le besoin de données sur le temps défavorable
La plupart des ensembles de données existants pour la segmentation sémantique 3D se concentrent sur des scénarios météorologiques normaux. C'est problématique pour des applications comme la conduite autonome, où les véhicules rencontrent différentes conditions météorologiques. Par exemple, la pluie peut créer des reflets et des distorsions dans les données LiDAR, rendant l'identification des objets difficile. De même, la neige peut couvrir les objets, les rendant invisibles. Il y a donc un besoin de données qui capturent ces scénarios pour améliorer la performance des modèles.
Aperçu de l'ensemble de données SemanticSTF
SemanticSTF est une avancée significative car il étend les ensembles de données précédents en incluant des Nuages de points capturés par mauvais temps. L'ensemble de données comprend des points classés en différentes classes sémantiques, comme des routes, des bâtiments et des véhicules. Il se compose de 2 076 scans provenant de diverses conditions météorologiques, y compris du brouillard dense, du léger brouillard, de la neige et de la pluie.
Les données sont divisées en trois ensembles : entraînement, validation et test. Cela aide à garantir que les modèles peuvent être évalués de manière juste et efficace.
Collecte et annotation des données
Collecter des données dans des conditions défavorables est un défi. Les systèmes LiDAR utilisent des impulsions laser pour mesurer les distances, mais des facteurs comme la pluie, le brouillard et la neige peuvent interférer avec ces mesures. Cela peut entraîner des points manquants, du bruit ou des formes déformées.
Pour créer l'ensemble de données SemanticSTF, les chercheurs ont sélectionné des scans d'un ensemble de données précédent (STF) qui contenait plusieurs modalités, y compris des données LiDAR. Les scans sélectionnés ont ensuite été annotés avec des étiquettes point par point, un processus détaillé et laborieux. Des annotateurs qualifiés ont été formés pour étiqueter chaque point avec précision, utilisant des ressources supplémentaires comme des images 2D pour référence.
Défis de l'annotation
Annoter des nuages de points par mauvais temps est plus difficile que dans des conditions normales. Les principaux défis incluent :
Distorsions géométriques : Le mauvais temps peut déformer les formes des objets, rendant leur reconnaissance et leur étiquetage corrects difficiles.
Régions invalides : Certaines zones peuvent être couvertes de neige ou d'autres matériaux, rendant difficile l'identification des caractéristiques.
Processus chronophage : Les annotateurs ont passé des heures à étiqueter les données, surtout dans des zones complexes.
Malgré ces défis, l'équipe a travaillé dur pour produire des annotations de haute qualité, essentielles pour former des modèles efficaces.
Résumé et statistiques des données
L'ensemble de données SemanticSTF comprend des annotations point par point pour 21 catégories. Certaines catégories, comme la route et le bâtiment, sont souvent rencontrées, tandis que d'autres comme le motocycliste et le cycliste sont moins courantes.
L'ensemble de données reflète des distributions du monde réel, montrant que les scènes de trafic présentent souvent des déséquilibres dans les types d'objets présents. Cela ressemble aux tendances observées dans d'autres ensembles de données bien connus.
Importance de l'adaptation et de la Généralisation de domaine
Alors que les véhicules opèrent dans divers environnements, ils doivent s'adapter à différentes conditions. Il y a deux concepts clés dans ce domaine : l'Adaptation de domaine et la généralisation de domaine.
Adaptation de domaine : Cela implique d'entraîner un modèle sur un type de données (comme le temps normal) et de l'adapter pour qu'il fonctionne bien sur un autre type (comme le temps défavorable).
Généralisation de domaine : Au lieu d'adapter un modèle entraîné, cette approche cherche à apprendre un modèle capable de gérer diverses conditions dès le départ.
Les deux stratégies visent à améliorer la performance des modèles lorsqu'ils sont confrontés à des scénarios météo inconnus.
PointDR : Une nouvelle approche
Pour améliorer la façon dont les modèles gèrent les données par mauvais temps, les chercheurs ont développé une méthode appelée PointDR. Cette technique utilise la randomisation de domaine pour améliorer l'entraînement des modèles.
Techniques de randomisation de domaine :
Randomisation du style géométrique : En appliquant différentes augmentations spatiales, le modèle apprend à reconnaître des objets même s'ils apparaissent différemment à cause des conditions météorologiques.
Agrégation d'embedding : Cela encourage le modèle à identifier des caractéristiques qui restent cohérentes malgré les changements, boostant ainsi son adaptabilité.
Grâce à PointDR, les chercheurs ont constaté que les modèles pouvaient mieux performer dans différentes conditions météorologiques, confirmant ainsi son efficacité.
Évaluation de la performance des modèles
Pour évaluer la performance des modèles formés sur SemanticSTF, des tests ont été réalisés avec divers ensembles de données de référence.
Tests de généralisation de domaine
Dans ces tests, les modèles formés avec des données de conditions météorologiques normales ont été évalués sur SemanticSTF. Cela a permis de mesurer à quel point les modèles se sont adaptés à des conditions défavorables sans réentraînement explicite.
Les résultats ont montré que même les modèles bien performants avaient du mal avec les données de temps défavorable, soulignant le besoin d'ensembles de données comme SemanticSTF.
Tests d'adaptation de domaine
Des tests ont également été effectués sur des méthodes qui adaptent les modèles formés avec des données de temps normal pour fonctionner avec des données de temps défavorable. Certaines de ces méthodes ont montré des résultats prometteurs, mais les améliorations de performance globales sont restées limitées.
Ces évaluations ont souligné l'importance de l'ensemble de données SemanticSTF dans les recherches futures pour construire des modèles tolérants au temps.
Remarques finales
La création de l'ensemble de données SemanticSTF marque une avancée importante dans la segmentation sémantique 3D. En s'attaquant aux défis posés par le temps défavorable, cet ensemble de données fournit une ressource précieuse pour les chercheurs.
Les résultats montrent que les modèles existants rencontrent des difficultés pour reconnaître des objets dans des conditions difficiles, ce qui indique un besoin clair de recherches et d'améliorations supplémentaires.
L'approche PointDR a montré un potentiel pour créer des modèles plus robustes capables de gérer une gamme de scénarios météorologiques. À mesure que la recherche progresse, il est probable que des solutions émergent pour améliorer la performance des véhicules autonomes et des drones dans des conditions réelles.
Directions futures
En regardant vers l'avenir, il y a beaucoup de pistes à explorer. Les chercheurs pourraient travailler sur l'affinement des représentations de nuages de points pour mieux gérer les distorsions causées par diverses conditions météorologiques. De plus, d'autres ensembles de données et benchmarks axés sur des conditions météorologiques spécifiques pourraient être développés pour faire avancer le domaine.
En continuant à étudier et à améliorer la façon dont les modèles gèrent des conditions défavorables, l'objectif d'atteindre une navigation autonome fiable et sécurisée dans toutes les conditions météorologiques peut être atteint.
Titre: 3D Semantic Segmentation in the Wild: Learning Generalized Models for Adverse-Condition Point Clouds
Résumé: Robust point cloud parsing under all-weather conditions is crucial to level-5 autonomy in autonomous driving. However, how to learn a universal 3D semantic segmentation (3DSS) model is largely neglected as most existing benchmarks are dominated by point clouds captured under normal weather. We introduce SemanticSTF, an adverse-weather point cloud dataset that provides dense point-level annotations and allows to study 3DSS under various adverse weather conditions. We study all-weather 3DSS modeling under two setups: 1) domain adaptive 3DSS that adapts from normal-weather data to adverse-weather data; 2) domain generalizable 3DSS that learns all-weather 3DSS models from normal-weather data. Our studies reveal the challenge while existing 3DSS methods encounter adverse-weather data, showing the great value of SemanticSTF in steering the future endeavor along this very meaningful research direction. In addition, we design a domain randomization technique that alternatively randomizes the geometry styles of point clouds and aggregates their embeddings, ultimately leading to a generalizable model that can improve 3DSS under various adverse weather effectively. The SemanticSTF and related codes are available at \url{https://github.com/xiaoaoran/SemanticSTF}.
Auteurs: Aoran Xiao, Jiaxing Huang, Weihao Xuan, Ruijie Ren, Kangcheng Liu, Dayan Guan, Abdulmotaleb El Saddik, Shijian Lu, Eric Xing
Dernière mise à jour: 2023-04-02 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2304.00690
Source PDF: https://arxiv.org/pdf/2304.00690
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.