Génération de trajets de circulation innovants grâce au langage naturel
InteractTraj crée des trajets de conduite réalistes qui reflètent les interactions entre les véhicules en utilisant des commandes en langage naturel.
― 8 min lire
Table des matières
Les simulations de trafic sont super importantes pour développer des voitures autonomes. Ces simulations aident à créer des scénarios de conduite qui peuvent être testés en toute sécurité. D'habitude, les anciennes méthodes se concentraient sur la création de trajets pour un seul véhicule, sans prendre en compte les interactions entre plusieurs véhicules sur la route. Comprendre comment les voitures s’influencent les unes les autres est crucial pour faire des simulations réalistes.
Ce travail présente une méthode appelée InteractTraj, qui génère des trajets de trafic en tenant compte de l’interaction entre les véhicules. En prenant des commandes en langage naturel, le système peut créer des trajets qui reflètent des comportements de conduite réalistes, ce qui rend plus facile le contrôle de ce qui se passe sur la route.
Le besoin de simulations de trafic réalistes
Avec l'avancement de la technologie des voitures autonomes, le besoin de simulations efficaces augmente. Les méthodes traditionnelles se concentraient principalement sur les mouvements des véhicules individuels sans tenir compte des interactions, qui sont essentielles dans le trafic réel. Les scénarios de conduite réels impliquent souvent de nombreux véhicules interagissant de près, ce qui rend difficile de prédire avec précision les trajets individuels.
Les simulations de conduite fournissent un moyen de créer et de tester divers scénarios sans mettre en danger la sécurité. Elles aident à générer des données sur le comportement des véhicules dans différentes conditions, permettant aux systèmes autonomes d’apprendre et de s’adapter. L’objectif est de produire des données de conduite qui représentent fidèlement les situations du monde réel.
Génération de trajectoires
Défis dans laLa génération efficace de trajectoires doit prioriser la contrôlabilité. Ça veut dire créer des trajets réalistes qui correspondent aux besoins des utilisateurs, comme tourner à gauche ou s’insérer dans le trafic. Bien que certaines méthodes permettaient un certain contrôle sur les trajets, elles manquaient de flexibilité et étaient limitées à des conditions prédéfinies.
Les techniques plus récentes utilisent de grands modèles de langage pour améliorer la flexibilité. Ces modèles permettent aux utilisateurs de décrire des scénarios en langage naturel, rendant le tout plus convivial. Cependant, beaucoup de ces méthodes se concentrent encore sur des véhicules uniques et ne tiennent pas compte de la façon dont plusieurs voitures interagissent.
Aperçu d’InteractTraj
InteractTraj est une nouvelle approche qui utilise des descriptions en langage naturel pour créer des trajets prenant en compte les interactions entre véhicules. Ça se concentre sur la traduction des commandes en langage en codes numériques qui représentent les interactions entre les voitures. Ce système se compose de deux parties clés : un encodeur de langage en code et un décodeur de code en trajectoire.
Encodeur de langage en code
La première partie d’InteractTraj transforme les commandes en langage naturel en codes structurés qui reflètent les interactions entre véhicules. Ça implique d’interpréter les commandes et de générer trois types de codes numériques : des codes d’interaction, des codes de véhicule et des codes de carte.
Codes d’interaction : Ces codes représentent comment les véhicules interagissent, y compris leurs positions relatives et leurs distances entre eux. En capturant cette info, le système peut modéliser efficacement les relations entre les véhicules.
Codes de véhicule : Ces codes décrivent l’état des véhicules individuels, couvrant des aspects comme leurs mouvements et comportements sur la route. Ils incluent des infos sur leurs actions actuelles, comme tourner, s’arrêter ou changer de voie.
Codes de carte : Ces codes offrent des infos sur l’environnement routier, incluant des détails comme le nombre de voies et la proximité des intersections. Les codes de carte aident le système à comprendre où se trouvent les véhicules et comment ils doivent se comporter en fonction de la structure de la route.
Décodeur de code en trajectoire
La deuxième partie d’InteractTraj prend les codes générés et crée des trajets de trafic interactifs. Ce composant combine des infos sur les interactions entre véhicules avec des données de carte environnementale pour produire des mouvements réalistes.
Pour résumer, InteractTraj prend une série de commandes en langage naturel, les traduit en codes numériques qui représentent comment les véhicules vont interagir et se comporter, et génère ensuite des trajectoires réalistes basées sur ces informations.
Configuration des expériences
Pour tester l’efficacité d’InteractTraj, des expériences ont été menées en utilisant deux ensembles de données réelles : le Waymo Open Motion Dataset et nuPlan. Ces ensembles de données incluent de véritables scénarios de conduite avec des chemins de véhicules correspondants.
Les expériences avaient pour but de comparer les performances d’InteractTraj avec celles des méthodes existantes. En se concentrant sur différents types de comportements de conduite, les tests étaient conçus pour évaluer à quel point les trajets générés étaient réalistes et à quel point ils correspondaient aux descriptions fournies.
Métriques d’évaluation
Plusieurs métriques ont été utilisées pour évaluer la performance d’InteractTraj :
Erreur de déplacement moyenne (mADE) : Mesure la distance moyenne entre les positions prévues des véhicules et les positions réelles au fil du temps. Une valeur plus basse indique un meilleur ajustement.
Erreur de déplacement final moyenne (mFDE) : Se concentre sur les positions finales des véhicules, mesurant à quel point les points d’arrivée prévus sont proches des points d’arrivée réels.
Taux de collision : Évalue combien de scénarios générés ont entraîné des collisions entre véhicules.
Ces métriques offrent un aperçu complet de la performance d’InteractTraj dans la génération de scénarios de trafic réalistes.
Résultats
Les résultats ont montré qu’InteractTraj surperformait significativement les méthodes existantes dans la génération de trajets de conduite réalistes et interactifs. Il a traduit efficacement les commandes en langage naturel en interactions détaillées entre véhicules, conduisant à des trajectoires plus précises qui reflétaient des scénarios de conduite du monde réel.
Comparaison avec les méthodes existantes
En comparant InteractTraj aux méthodes précédentes, il a constamment obtenu des erreurs de déplacement et des taux de collision plus bas. L'incorporation de codes d’interaction a permis aux véhicules de réagir les uns aux autres sur les routes simulées, améliorant ainsi le réalisme.
InteractTraj a également excellé dans la gestion de divers types d’interactions, comme le fait de s’insérer, de céder le passage et de dépasser. Cette flexibilité dans la génération de trajets en fonction des commandes des utilisateurs le distingue des anciennes méthodes qui étaient limitées à des scénarios prédéfinis.
Études utilisateur
Pour recueillir des retours sur les scénarios générés, des études utilisateur ont été réalisées. Les participants ont été présentés avec des commandes en langage et les trajectoires générées correspondantes. Ils ont été invités à choisir quelles trajectoires correspondaient le mieux aux descriptions.
Les résultats ont montré une forte préférence pour les scénarios produits par InteractTraj par rapport à ceux générés par des modèles existants. Cela indique que les utilisateurs trouvaient que les sorties d’InteractTraj étaient mieux alignées avec leurs attentes basées sur des descriptions en langage naturel.
Résumé des préférences des utilisateurs
Les participants ont noté qu’InteractTraj générait des scénarios qui reflétaient les interactions, les rendant plus réalistes. Les utilisateurs ont exprimé une différence notable de qualité entre les deux méthodes, avec InteractTraj atteignant des taux de satisfaction plus élevés en répondant aux exigences des utilisateurs.
Limitations et travaux futurs
Bien qu’InteractTraj montre un potentiel significatif, certaines limites doivent être abordées. Actuellement, il se concentre principalement sur les trajectoires des véhicules, avec un potentiel d'expansion pour inclure d'autres types de participants au trafic et une génération de cartes variée.
Les travaux futurs viseront à améliorer la capacité de la méthode à gérer divers scénarios de trafic et à intégrer des interactions plus complexes dans les trajets générés. Cela améliorera encore son applicabilité dans le développement de systèmes de conduite autonomes robustes.
Conclusion
InteractTraj représente une avancée significative dans la génération de trajectoires de trafic interactives. En utilisant des commandes en langage naturel, il est capable de produire des interactions de véhicule réalistes qui améliorent la qualité des simulations de conduite. Cette méthode fournit une base prometteuse pour la recherche et les applications futures dans la technologie de conduite autonome, visant à créer des scénarios de conduite plus sûrs et plus efficaces.
Titre: Language-Driven Interactive Traffic Trajectory Generation
Résumé: Realistic trajectory generation with natural language control is pivotal for advancing autonomous vehicle technology. However, previous methods focus on individual traffic participant trajectory generation, thus failing to account for the complexity of interactive traffic dynamics. In this work, we propose InteractTraj, the first language-driven traffic trajectory generator that can generate interactive traffic trajectories. InteractTraj interprets abstract trajectory descriptions into concrete formatted interaction-aware numerical codes and learns a mapping between these formatted codes and the final interactive trajectories. To interpret language descriptions, we propose a language-to-code encoder with a novel interaction-aware encoding strategy. To produce interactive traffic trajectories, we propose a code-to-trajectory decoder with interaction-aware feature aggregation that synergizes vehicle interactions with the environmental map and the vehicle moves. Extensive experiments show our method demonstrates superior performance over previous SoTA methods, offering a more realistic generation of interactive traffic trajectories with high controllability via diverse natural language commands. Our code is available at https://github.com/X1a-jk/InteractTraj.git
Auteurs: Junkai Xia, Chenxin Xu, Qingyao Xu, Chen Xie, Yanfeng Wang, Siheng Chen
Dernière mise à jour: 2024-05-24 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.15388
Source PDF: https://arxiv.org/pdf/2405.15388
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.