Avancées dans le cadre de test des véhicules autonomes
Un nouveau cadre améliore les scénarios de test pour les véhicules autonomes dans les parkings.
― 11 min lire
Table des matières
- Le rôle des simulateurs 3D
- Automatisation de la création de scènes
- Composants des systèmes de conduite autonome
- Défis dans le test des véhicules autonomes
- La nécessité de scénarios défavorables
- Le cadre automatisé
- Avantages du cadre proposé
- Aperçu des travaux connexes
- Importance de l'apprentissage par renforcement
- Conception de l'environnement pour la génération de scénarios
- Développement de la fonction de récompense
- Génération de cartes 3D
- Métriques d'évaluation pour les scénarios générés
- Réalisation d'expériences
- La relation entre la difficulté du garage et les taux de réussite
- Conclusion
- Source originale
- Liens de référence
Les Véhicules autonomes sont conçus pour conduire tout seuls avec peu ou pas d'intervention humaine. Pour s'assurer que ces véhicules peuvent fonctionner en toute sécurité, ils doivent être testés de manière approfondie. Un moyen de le faire est d'utiliser la simulation, où des environnements virtuels peuvent reproduire des scénarios du monde réel. Ces simulations permettent aux chercheurs de tester à quel point le véhicule réagit bien à diverses situations sans les risques liés aux tests réels.
Le rôle des simulateurs 3D
Ces dernières années, il y a eu des avancées significatives dans la technologie de simulation de conduite. Avant, les simulations étaient en grande partie en 2D et ne donnaient que des vues aériennes des scénarios de conduite. L'introduction de simulateurs tridimensionnels (3D), comme Carla et CarSim, a changé la donne. Ces environnements 3D offrent une représentation plus précise du monde réel, permettant un meilleur test des véhicules autonomes.
Créer ces environnements n'est pas une tâche simple. Les expérimentateurs doivent souvent créer à la fois des scènes statiques (comme des bâtiments et des routes) et des éléments dynamiques (comme le trafic en mouvement et les piétons). Ce processus implique souvent beaucoup de travail manuel, ce qui peut prendre du temps.
Automatisation de la création de scènes
Pour relever les défis de la construction manuelle des scènes, un programme automatisé a été proposé. Ce programme, basé sur l'Apprentissage par renforcement profond, peut générer différents scripts pouvant être utilisés pour construire des modèles 3D dans un simulateur. Grâce à cette approche automatisée, les chercheurs peuvent créer plus efficacement divers scénarios de conduite.
Les scènes résultantes peuvent être utilisées dans le simulateur Carla, qui est spécialement conçu pour tester les algorithmes de navigation des véhicules autonomes. L'objectif est de rendre les tests plus rapides et plus complets.
Composants des systèmes de conduite autonome
Au cœur de tout système de conduite autonome, il y a trois parties principales : la perception, la prise de décision et le contrôle. La composante de perception traite les données provenant de différents capteurs pour comprendre l'environnement. Ces informations sont ensuite utilisées pour la prise de décision, qui détermine comment le véhicule doit agir. Enfin, le système de contrôle exécute les mouvements spécifiques nécessaires pour que le véhicule navigue.
Les capteurs jouent un rôle crucial dans la collecte d'informations sur l'environnement. Les données collectées aident le véhicule à se comporter de manière appropriée dans diverses situations. Cependant, les tests montrent que les véhicules autonomes doivent parcourir un nombre énorme de kilomètres - plus de 11 milliards de miles - pour garantir leur sécurité.
Défis dans le test des véhicules autonomes
Tester des véhicules autonomes présente des défis importants. Les accidents de la circulation impliquant ces véhicules peuvent entraîner des contrôles et des préoccupations concernant la sécurité. Par conséquent, il y a eu un passage des méthodes de test traditionnelles aux tests basés sur la simulation. Les tests de simulation permettent aux chercheurs de créer divers scénarios de conduite dans un environnement contrôlé.
Ce type de test est efficace en termes de ressources et peut aider à évaluer les performances des algorithmes de conduite de manière plus efficace. La flexibilité de la simulation permet des tests spécifiques, comme des tests unitaires axés sur des fonctions particulières.
La nécessité de scénarios défavorables
Un aspect crucial des tests consiste à créer des scénarios défavorables qui peuvent mettre à l'épreuve les systèmes du véhicule. Ces scénarios sont conçus pour tester à quel point les algorithmes de conduite autonome fonctionnent sous pression. Malheureusement, il n'existe pas beaucoup de scénarios open source disponibles qui se concentrent sur les parkings souterrains, un environnement commun où les véhicules autonomes opèrent.
Pour les véhicules entièrement autonomes, le valet automatique est la dernière tâche d'un parcours. Dans cette situation, les passagers laissent le véhicule dans une zone de dépose désignée, et la voiture doit se garer seule. Créer des environnements de simulation réalistes pour ces tâches de stationnement est essentiel.
Le cadre automatisé
Pour relever les défis de la construction de ces scénarios défavorables, un cadre de génération automatisé est proposé. Ce cadre vise à créer divers scénarios de garage souterrain pour tester les tâches de valet automatisé. Il promet plusieurs avantages :
Construction de scènes automatisée : Le cadre peut créer différentes scènes statiques pour les garages souterrains sans avoir besoin d'un travail manuel étendu.
Génération de scénarios divers : En utilisant l'apprentissage par renforcement profond, divers scénarios peuvent être produits qui mettent à l'épreuve les capacités du véhicule.
Options personnalisables : Les utilisateurs peuvent saisir différents paramètres et cartes initiales, permettant différents résultats dans les scénarios générés.
Avantages du cadre proposé
Les principaux avantages de ce cadre automatisé peuvent être résumés comme suit :
Efficacité dans la construction de scènes : Le temps que les chercheurs passent à construire des scènes statiques peut être considérablement réduit.
Résultats de haute qualité : Le cadre applique des techniques d'apprentissage par renforcement, garantissant que les scénarios générés sont variés et ressemblent étroitement aux conditions du monde réel.
Couverture de test accrue : En générant des scénarios divers et difficiles, le cadre contribue à améliorer l'ensemble des tests des algorithmes de véhicules autonomes.
Aperçu des travaux connexes
La création de scènes de test de simulation pour véhicules autonomes est encore en développement. Ce domaine se concentre particulièrement sur la génération de contenu procédural, qui consiste à créer des environnements de type jeu basés sur des algorithmes. Plusieurs méthodes existantes sont utilisées pour générer des réseaux routiers et des scènes de test, allant de l'utilisation de règles à des approches d'apprentissage automatique.
Bien que de nombreux travaux se soient concentrés sur des environnements urbains, le domaine spécifique des garages souterrains reste sous-exploré. Par conséquent, utiliser l'apprentissage par renforcement profond pour générer des scénarios spécifiquement pour les garages de stationnement représente une opportunité passionnante d'avancement dans ce domaine.
Importance de l'apprentissage par renforcement
L'apprentissage par renforcement est une approche d'apprentissage automatique où les agents apprennent à prendre des décisions en interagissant avec leur environnement pour maximiser les récompenses. Dans ce contexte, l'agent est le véhicule ou le système testé, tandis que l'environnement fait référence au garage de stationnement virtuel. L'agent prend des mesures en fonction des informations reçues de son environnement, ce qui l'aide à apprendre au fil du temps.
Cette technique permet la génération dynamique de scénarios, car l'agent adaptera ses actions en fonction de la situation actuelle. Grâce à un entraînement continu, l'agent peut améliorer sa performance dans la navigation dans des environnements complexes.
Conception de l'environnement pour la génération de scénarios
Créer un environnement efficace pour le test nécessite de réfléchir attentivement à ce qui constitue l'état et les actions de l'agent. Par exemple, l'agent doit connaître sa position dans le garage de stationnement et les mouvements possibles qu'il peut effectuer, comme se déplacer à gauche ou à droite ou colorer des blocs au fur et à mesure qu'il progresse.
Un environnement partiellement observable signifie que l'agent n'a pas une visibilité complète de toute la structure du garage. Au lieu de cela, il s'appuie sur un sous-ensemble d'informations pour prendre des décisions, ce qui reflète les situations de conduite réelles où un conducteur ne peut pas voir tout d'un coup.
Développement de la fonction de récompense
La fonction de récompense est essentielle pour guider le processus d'apprentissage de l'agent. Elle définit quelles actions sont souhaitables et celles qu'il faut éviter. Le système de récompense est basé sur des règles liées à la conception des garages et à l'expérience utilisateur. Les récompenses positives encouragent les actions qui mènent à une meilleure utilisation de l'espace, tandis que les récompenses négatives découragent les actions qui entraînent des collisions ou des agencements inefficaces.
En alignant de près le système de récompense avec les règles réelles des garages, le cadre peut générer des scénarios qui sont non seulement fonctionnels, mais aussi réalistes.
Génération de cartes 3D
Une fois que la matrice d'encodage est établie, elle peut être convertie en matrices de réseaux routiers, qui décrivent comment différents éléments dans le garage sont connectés. Ces réseaux routiers peuvent ensuite générer des modèles 3D en utilisant des structures préconstruites, créant une représentation virtuelle du garage de stationnement dans le simulateur.
Les cartes générées peuvent inclure divers types de routes et d'intersections, simulant des scénarios de conduite réels. L'objectif final est d'avoir un ensemble complet de cartes pouvant être importées dans le logiciel de simulation pour les tests.
Métriques d'évaluation pour les scénarios générés
Pour évaluer l'efficacité des garages de stationnement générés, deux métriques sont employées : la couverture et la difficulté. La couverture évalue combien de chemins sont disponibles dans le garage, tandis que la difficulté évalue la complexité de ces chemins. Ces métriques fournissent des idées sur la manière dont le cadre génère des scénarios divers et utilisables.
Réalisation d'expériences
La phase expérimentale implique de former l'agent à l'aide de plusieurs cartes initiales. Le processus d'entraînement permet à l'agent d'apprendre comment mieux naviguer dans le garage de stationnement tout en essayant de minimiser les pénalités dues aux collisions ou aux mouvements inefficaces. Les résultats de ces expériences peuvent aider à identifier quels designs fonctionnent mieux et à améliorer le cadre encore plus.
La relation entre la difficulté du garage et les taux de réussite
Lors de tests des algorithmes de conduite autonome dans ces garages, il est crucial de comprendre la relation entre la complexité du garage et le taux de réussite. En analysant les performances du véhicule alors qu'il navigue dans divers garages, les chercheurs peuvent identifier des tendances qui révèlent à quel point certaines conceptions sont difficiles pour le véhicule.
Les taux de réussite peuvent varier en fonction de la structure du garage. Les garages plus simples tendent à donner des taux de réussite plus élevés, tandis que des structures plus complexes peuvent entraîner des taux d'échec plus élevés en raison de la difficulté de naviguer dans des espaces étroits ou de rencontrer des obstacles.
Conclusion
Ce cadre proposé pour générer des scénarios défavorables pour les véhicules autonomes dans les garages souterrains vise à améliorer considérablement les méthodes de test. En automatisant le processus de construction de scènes et en utilisant l'apprentissage par renforcement profond, les chercheurs peuvent créer des environnements de test plus réalistes et variés.
Les avantages de ce cadre sont évidents : il fait gagner du temps, produit des scénarios de haute qualité et améliore la couverture générale des tests pour les algorithmes de véhicules autonomes. En fin de compte, ce cadre contribue à la sécurité et à la fiabilité des systèmes de conduite autonome, s'assurant qu'ils peuvent gérer une large gamme de défis du monde réel.
Les améliorations futures pourraient se concentrer sur le raffinement de la fonction de récompense, l'exploration de différentes techniques d'apprentissage automatique et l'intégration d'éléments dynamiques comme des piétons ou des véhicules en mouvement dans les scénarios générés. En avançant dans ce domaine de recherche, nous pouvons mieux préparer les véhicules autonomes à fonctionner en toute sécurité dans des environnements complexes.
Titre: Deep Reinforcement Learning for Adverse Garage Scenario Generation
Résumé: Autonomous vehicles need to travel over 11 billion miles to ensure their safety. Therefore, the importance of simulation testing before real-world testing is self-evident. In recent years, the release of 3D simulators for autonomous driving, represented by Carla and CarSim, marks the transition of autonomous driving simulation testing environments from simple 2D overhead views to complex 3D models. During simulation testing, experimenters need to build static scenes and dynamic traffic flows, pedestrian flows, and other experimental elements to construct experimental scenarios. When building static scenes in 3D simulators, experimenters often need to manually construct 3D models, set parameters and attributes, which is time-consuming and labor-intensive. This thesis proposes an automated program generation framework. Based on deep reinforcement learning, this framework can generate different 2D ground script codes, on which 3D model files and map model files are built. The generated 3D ground scenes are displayed in the Carla simulator, where experimenters can use this scene for navigation algorithm simulation testing.
Auteurs: Kai Li
Dernière mise à jour: 2024-07-01 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2407.01333
Source PDF: https://arxiv.org/pdf/2407.01333
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://orcid.org/
- https://www.programmersought.com/article/12636730965/
- https://www.esri.com/en-us/arcgis/products/esri-cityengine
- https://www.autodesk.com/developer-network/platform-technologies/fbx-sdk-2020-0
- https://www.asam.net/standards/detail/opendrive/
- https://github.com/Tejas-Deo/Safe-Navigation-Training-Autonomous-Vehicles-using-Deep-Reinforcement-Learning-in-CARLA