Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique# Vision par ordinateur et reconnaissance des formes# Robotique

AI Racing : Dépasser les pilotes humains

Un nouveau programme d'IA bat les conducteurs humains en utilisant seulement les données internes de la voiture.

― 9 min lire


L'IA dépasse les humainsL'IA dépasse les humainsen course.internes de la voiture.utilisant seulement les donnéesL'IA bat les pilotes humains en
Table des matières

Les voitures de course utilisant l'intelligence artificielle (IA) ont été un gros objectif pour les chercheurs en IA et en robotique. L'idée est de créer des machines qui peuvent courir plus vite que les meilleurs pilotes humains. Récemment, un programme informatique intelligent a réussi ça dans un jeu de course vidéo populaire appelé Gran Turismo. Cependant, ce programme s'appuyait sur des informations venant de l'extérieur de la voiture, ce qui n'est pas comme ça que les pilotes humains courent. Ce travail présente un nouveau programme IA qui peut courir mieux que les humains en utilisant seulement les informations disponibles à l'intérieur de la voiture, comme les images d'une caméra à l'intérieur de la voiture et la vitesse de la voiture.

Courir avec l'IA

Pour courir avec succès, le programme doit accomplir trois tâches clés :

  1. Il doit comprendre la situation actuelle de la voiture en utilisant les informations de ses capteurs.
  2. Il doit planifier le meilleur moyen de conduire tout en évitant les obstacles et les autres voitures.
  3. Il doit contrôler la voiture, en tenant compte de son comportement différent selon les conditions routières.

Les avancées récentes dans une méthode appelée apprentissage par renforcement profond (RL) ont montré des promesses pour entraîner l'IA à courir en lui permettant d'apprendre de ses propres erreurs pendant qu'elle court sur un circuit. Cependant, de nombreux agents IA existants ne peuvent toujours pas courir aussi vite que les pilotes humains moyens.

L'objectif

Ce travail vise à développer une IA qui peut constamment surpasser les meilleurs pilotes humains. Les méthodes précédentes qui ont réussi nécessitaient des informations venant de l'extérieur de la voiture pendant une course. Cette étude pose la question de savoir s'il est possible de former un agent IA en utilisant uniquement des caractéristiques locales, ou des détails que la voiture peut percevoir par elle-même, afin qu'elle puisse toujours performer à un niveau surhumain.

Défis

La course présente plusieurs défis. Par exemple, lorsqu'elle s'approche d'un virage serré, l'IA pourrait ne pas voir l'apex du virage (le point le plus proche du virage) et la fin de la courbe, qui sont critiques pour prendre des décisions de conduite. Pour y faire face, l'équipe a utilisé une architecture avancée appelée critique-acteur asymétrique. Cette configuration permet à l'IA d'accéder à des informations complètes pendant l'Entraînement tout en utilisant uniquement les données locales disponibles pendant la course réelle.

Tester l'IA

L'agent IA a été testé dans le simulateur Gran Turismo 7, montrant sa capacité à réaliser des temps de tour plus rapides que n'importe quel pilote humain. Les résultats sur divers circuits et voitures ont montré que la performance de l'IA était significativement influencée par les informations visuelles qu'elle recevait.

Importance des entrées visuelles

L'entraînement de l'agent a inclus diverses expériences pour mesurer à quel point il dépendait des données visuelles. Les résultats ont souligné que l'IA a besoin de données visuelles pour naviguer efficacement sur les circuits de course. De nouveaux patterns de conduite sont apparus du processus de prise de décision de l'IA, la distinguant des meilleurs pilotes humains.

Décomposition des caractéristiques

Pour construire les capacités de course de l'IA, l'équipe a considéré différents types de caractéristiques :

Caractéristiques Visuelles

L'IA a utilisé des images prises d'une caméra égocentrique (une caméra pointée depuis la perspective du conducteur) à une résolution spécifique pour comprendre le circuit. Les images ont été traitées pour garantir la clarté tout en éliminant les données inutiles à l'écran, comme le compteur de vitesse.

Caractéristiques propriocentriques

Ces caractéristiques se rapportent à la façon dont la voiture se déplace dans l'espace. Elles étaient basées sur des mesures physiques simples comme la vitesse de la voiture, l'accélération et l'angle de direction. Ces points de données aident l'IA à évaluer sa performance sur le circuit.

Caractéristiques globales

Des caractéristiques uniques du circuit, comme sa forme et ses limites, ont également été fournies au processus d'entraînement mais n'ont pas été utilisées pendant la course. Cette méthode permet à l'IA de prendre ses propres décisions de conduite uniquement sur la base de ce qu'elle perçoit en temps réel.

Mesurer le succès

L'IA a été évaluée à travers des essais chronométrés où elle a couru seule sur le circuit, visant à compléter des tours dans le temps le plus court possible. Les résultats ont révélé que l'IA surpassait constamment les pilotes humains, peu importe les conditions de circuit et de voiture. Elle a réalisé des temps de tour qui étaient, en moyenne, meilleurs que ceux de plus de 130 000 courses humaines analysées.

Récompenses et reconnaissance

Ce travail est notable car c'est la première fois qu'un agent IA, ne s'appuyant que sur des caractéristiques locales, a surpassé tous les pilotes humains dans plusieurs scénarios de course. Encore plus impressionnant, c'est comment l'IA a maintenu des niveaux de performance élevés à travers une variété de tests et de conditions.

Recherche connexe

Dans le cadre plus large de la course autonome, de nombreux efforts ont été consacrés au développement de systèmes qui aident les voitures à naviguer en utilisant des technologies avancées. Ces efforts peuvent être divisés en trois grandes catégories :

Perception

Ce domaine se concentre sur la façon dont les voitures reconnaissent leur environnement pendant la course. La recherche a lancé des systèmes à grande vitesse pour détecter des objets et cartographier les environnements, aidant les véhicules autonomes à comprendre où ils se trouvent et ce qui les entoure.

Planification

Ici, l'objectif est de concevoir le meilleur itinéraire ou plan pour la voiture tout en tenant compte à la fois de la vitesse et de la sécurité. Les chercheurs ont utilisé des méthodes d'optimisation pour dériver des trajectoires optimales qui peuvent être utilisées pendant les courses.

Contrôle

Les méthodes de contrôle garantissent que la voiture reste sur la bonne voie et suit le plan prévu aussi près que possible. Celles-ci n'ont pas été largement explorées dans le contexte de la course jusqu'à présent. La recherche actuelle met en évidence une technique de bout en bout, consolidant la perception, la planification et le contrôle, qui a montré qu'elle surpassait les méthodes précédentes.

Apprentissage par renforcement basé sur la vision

Des études suggèrent que l'utilisation de l'apprentissage par renforcement basé sur la vision peut aider à mieux comprendre les dynamiques de course. Diverses méthodes ont intégré à la fois des données visuelles et des métriques spécifiques à la voiture pour apprendre aux agents de course comment fonctionner efficacement.

Performance surhumaine

Des avancées récentes montrent que certains agents IA de course peuvent dépasser les pilotes humains lors des essais chronométrés. Cependant, beaucoup de ces méthodes dépendent encore de données externes pour prendre des décisions de course. L'étude actuelle souligne qu'il est possible d'atteindre une performance de course supérieure en utilisant uniquement des caractéristiques disponibles en interne.

L'approche asymétrique

La recherche introduit une méthode d'entraînement asymétrique, permettant à l'IA d'apprendre efficacement tout en concourant. Ce modèle d'entraînement permet à l'IA de fonctionner en utilisant ses propres données sensorielles, la préparant à gérer des scénarios de course réels.

Observer l'IA en action

À travers diverses conditions de test, l'IA a démontré sa capacité à apprendre et à adapter sa stratégie de course. Comparer sa performance à celle des pilotes humains a montré non seulement une vitesse, mais aussi un style de conduite unique.

Évaluation des performances

Le processus d'évaluation a inclus la mesure des temps de tour dans différents scénarios, y compris diverses conditions météorologiques et moments de la journée. L'IA a continuellement prouvé sa valeur, et sa capacité à naviguer dans des variables changeantes était remarquable.

Leçons apprises

Une analyse détaillée des schémas de conduite de l'IA a révélé des différences clés par rapport aux pilotes humains. L'IA a utilisé les bords de la piste efficacement, a changé de ligne en douceur et a fait des ajustements rapides basés sur des données visuelles immédiates. Cette adaptabilité pourrait également servir à former des pilotes humains, offrant des perspectives d'un agent à hautes performances constant.

Travaux futurs

La recherche laisse entrevoir plusieurs avenues pour de futures explorations :

  1. Course multi-voitures : Le prochain objectif est de permettre à l'IA de courir contre d'autres véhicules, créant un environnement de course plus réaliste.

  2. Réduction des besoins en entrée : Les prochaines itérations pourraient incorporer des réseaux récurrents pour minimiser le besoin de certains types d'entrée, rendant l'IA encore plus efficace.

  3. Généralisation : Augmenter la capacité de l'IA à gérer des conditions inconnues, comme des circuits variés et des types de véhicules inconnus, est essentiel pour les applications réelles.

Implications plus larges

Cette recherche peut avoir un impact significatif sur la technologie de course dans le monde réel. En se concentrant uniquement sur les caractéristiques internes de la voiture, les véhicules autonomes nécessiteront moins de dépendance à des systèmes externes, aidant à réduire les coûts et les complexités dans des environnements dynamiques.

Conclusion

En résumé, ce travail a réalisé une avancée majeure dans la course IA, montrant qu'un agent peut conduire mieux que des experts humains sans avoir besoin d'entrées externes. Les résultats ouvrent la voie à un développement futur dans la course autonome et mettent en lumière le potentiel d'implémentations pratiques dans le monde de la course compétitive. Les implications de l'étude vont au-delà de l'amélioration de la performance de course - elles pourraient aussi mener à des technologies de conduite plus sûres et plus efficaces à l'avenir.

Source originale

Titre: A Super-human Vision-based Reinforcement Learning Agent for Autonomous Racing in Gran Turismo

Résumé: Racing autonomous cars faster than the best human drivers has been a longstanding grand challenge for the fields of Artificial Intelligence and robotics. Recently, an end-to-end deep reinforcement learning agent met this challenge in a high-fidelity racing simulator, Gran Turismo. However, this agent relied on global features that require instrumentation external to the car. This paper introduces, to the best of our knowledge, the first super-human car racing agent whose sensor input is purely local to the car, namely pixels from an ego-centric camera view and quantities that can be sensed from on-board the car, such as the car's velocity. By leveraging global features only at training time, the learned agent is able to outperform the best human drivers in time trial (one car on the track at a time) races using only local input features. The resulting agent is evaluated in Gran Turismo 7 on multiple tracks and cars. Detailed ablation experiments demonstrate the agent's strong reliance on visual inputs, making it the first vision-based super-human car racing agent.

Auteurs: Miguel Vasco, Takuma Seno, Kenta Kawamoto, Kaushik Subramanian, Peter R. Wurman, Peter Stone

Dernière mise à jour: 2024-06-18 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2406.12563

Source PDF: https://arxiv.org/pdf/2406.12563

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires