Die Steuerung autonomer Fahrzeuge mit Simulation
Eine neue Methode ermöglicht es autonomen Fahrzeugen, ohne reale Daten gesteuert zu werden.
― 6 min Lesedauer
Inhaltsverzeichnis
Dieser Artikel behandelt die Entwicklung einer neuen Methode zur Steuerung eines skalierten autonomen Fahrzeugs, ohne auf reale Daten angewiesen zu sein. Der Fokus liegt darauf, Simulationen zu nutzen, um ein Steuerungssystem zu schaffen, das effektiv in der realen Welt funktioniert, ohne vorherige Erfahrung aus tatsächlichen Fahrsituationen. Das nennt man Zero-Shot Transfer (ZST). Der Ansatz verwendet ein neuronales Netzwerk (NN), das aus spezifischen simulierten Fahrszenarien lernt, sodass das Fahrzeug vorgegebene Wege sowohl mit konstanten als auch mit variierenden Geschwindigkeiten folgen kann.
Simulation im Fahrzeugdesign
Simulation spielt eine entscheidende Rolle beim Design von Robotern und autonomen Fahrzeugen. Mit simulierten Umgebungen können Forscher Kosten senken, den Designprozess beschleunigen und viele verschiedene Designs in verschiedenen Situationen testen, die in der realen Welt schwer nachzuahmen sind. Es gibt jedoch eine Herausforderung, die als "Simulation-to-Reality"-Lücke bekannt ist. Diese Lücke bedeutet, dass ein Algorithmus, der in der Simulation gut funktioniert, in der realen Welt möglicherweise nicht wie erwartet funktioniert, wegen der komplexen Aspekte, die schwer in Simulationen zu modellieren sind, wie Verzögerungen im Betrieb oder Ungenauigkeiten in Sensordaten.
Die Nutzung von maschinellem Lernen zur Erstellung von Steuerungspolitiken verstärkt dieses Problem, da der Lernprozess völlig auf simulierten Informationen basiert. Frühere Ansätze zu ZST zeigten oft entweder keine reale Effektivität oder benötigten eine Mischung aus simulierten und echten Daten für das Training.
Allgemeiner Ansatz
Diese Studie schlägt eine allgemeine Methode vor, die eine spezifische Simulationsplattform verwendet, um einen auf maschinellem Lernen basierenden Controller zu erstellen und diesen dann an einem skalierten Fahrzeug zu testen. Die wichtigsten Beiträge dieser Forschung sind:
- Verwendung eines hochpräzisen Physik-Simulators, der es ermöglicht, Steuerungspolitiken zu entwickeln, ohne die Simulation für verschiedene Bedingungen anpassen zu müssen.
- Einsatz eines neuronalen Netzwerks, das durch Nachahmung lernt und Daten nutzt, die von einer begrenzten Anzahl von Referenzrouten gesammelt werden. Diese Daten stammen entweder von einem menschlichen Fahrer in der Simulation oder von einem Model Predictive Control (MPC)-System, das das Fahrzeug auf festgelegten Wegen steuert.
- Nachweis, dass die Simulationsplattform effektiv die Entwicklung autonomer Systeme unterstützen kann, die für reale Anwendungen geeignet sind.
Verwandte Arbeiten
Während andere Studien versucht haben, Controller für autonome Fahrzeuge hauptsächlich durch Simulation zu entwickeln, sind viele immer noch auf reale Daten zur Validierung angewiesen. Zum Beispiel konzentrieren sich einige darauf, Lösungen zu entwickeln, die Kameras und andere Sensoren nutzen, um Informationen aus der Umgebung zu sammeln und direkt Steuerbefehle zu informieren. Andere haben versucht, die Simulation-to-Reality-Lücke zu überbrücken, indem sie simulierte Daten so umwandeln, dass sie echten Daten ähneln, benötigen jedoch dennoch einige echte Daten zur Verarbeitung.
Darüber hinaus nutzen viele bestehende Methoden Domain Randomization (DR), um Simulationen robuster zu machen. Das bedeutet, die Simulationsumgebung so zu ändern, dass die Algorithmen in realen Situationen besser funktionieren. Diese Studie meidet jedoch absichtlich DR und betont stattdessen die Effektivität des verwendeten Simulators.
Chrono- und ART/ATK-Plattformen
Die Forschung verwendet eine Simulations-Engine namens Chrono, die eine detaillierte Modellierung von Fahrzeugen und Sensoren ermöglicht. Diese Engine erlaubt die Erstellung verschiedener Fahrszenarien, was sie geeignet macht, um Steuerungssysteme zu trainieren. Die ART/ATK-Plattform integriert diese Simulations-Engine, sodass die Simulation und das tatsächliche Testen von autonomen Algorithmen am gleichen Fahrzeug möglich sind.
Die Plattform arbeitet mit ROS2 (Robot Operating System), was einen konsistenten Autonomie-Stack ermöglicht, der sowohl in Simulationen als auch in realen Tests läuft. Diese Kohärenz in Software und Hardware bietet einen grossen Vorteil für Echtzeittests und Leistungsevaluierungen.
Steuerungsmodell und Datensammlung
Um einen Controller für das Fahrzeug zu entwickeln, wird ein vereinfachtes Fahrzeugmodell verwendet, das essenzielle Dynamiken erfasst und gleichzeitig effiziente Berechnungen ermöglicht. Das Modell umfasst Zustände wie Position, Fahrtrichtung und Geschwindigkeit. Die Steuerbefehle beinhalten Lenk- und Gasbefehle, die das Fahrzeug entlang eines vorgegebenen Weges führen.
Trainingsdaten werden durch zwei Hauptmethoden gesammelt: Mensch-in-der-Schleife (HIL)-Simulation und MPC. In HIL-Simulationen steuert ein menschlicher Fahrer das virtuelle Fahrzeug und zeichnet seine Aktionen sowie den entsprechenden Fahrzeugzustand auf, wenn er von einer festgelegten Trajektorie abweicht. Alternativ generiert ein MPC-Ansatz Befehle, um das Fahrzeug basierend auf vordefinierten Bedingungen auf Kurs zu halten. Diese Daten sind entscheidend für das Training des NN, um das Fahrverhalten zu imitieren.
Training des neuronalen Netzwerks
Die Studie implementiert ein Feedforward-Neuronales Netzwerk, das lernt, das Fahrzeug basierend auf den gesammelten Trainingsdaten zu steuern. Dieses NN ist mit zwei verborgenen Schichten strukturiert, die dazu entworfen sind, passende Steuerbefehle basierend auf den Fehlerzuständen des Fahrzeugs vorherzusagen. Der Trainingsprozess konzentriert sich darauf, diese Fehlerzustände auf spezifische Fahrzeugaktionen abzubilden, sodass das NN lernt, effektiv in der Simulation und später im echten Fahrbetrieb zu reagieren.
Das Training des NN ist schnell und dauert nur wenige Minuten, aufgrund der Einfachheit der Eingangs- und Ausgangsdaten, was eine effiziente Modellierung und schnellere Iterationszyklen ermöglicht.
Tests und Ergebnisse
Um die Leistung des NN zu bewerten, wurden verschiedene Tests in einer Parkumgebung durchgeführt. Das NN wurde unter konstanten und variierenden Geschwindigkeitsbedingungen entlang unterschiedlicher Trajektorien getestet. Die Ergebnisse zeigten, dass das NN die Wege erfolgreich navigieren konnte und dabei sanft zwischen den Wegpunkten wechselte, während es den festgelegten Geschwindigkeitsprofilen folgte.
Bei den konstanten Geschwindigkeitstests folgte das Fahrzeug einer Route mit unterschiedlichen Kurven und geraden Strecken, was eine Bewertung der Genauigkeit des NNs ermöglichte, seine Trajektorie auf Befehl beizubehalten. Weitere Bewertungen beinhalteten Tests, wie gut das NN sich an wechselnde Geschwindigkeiten entlang seiner Route anpassen konnte.
Die Ergebnisse zeigten, dass der NN-Controller die Leistung erfolgreich von der Simulation in die Realität übertrug, trotz der inhärenten Komplexitäten des realen Fahrens. Beobachtungen zeigten Unterschiede basierend auf den Trainingsmethoden, wobei das NN, das mit HIL-Daten trainiert wurde, eine sanftere Steuerung aufwies, jedoch weniger Präzision zeigte als das NN, das durch das MPC-System trainiert wurde.
Fazit
Diese Studie hebt die erfolgreiche Anwendung von Zero-Shot Transfer zur Steuerung skalierten autonomer Fahrzeuge durch Simulation hervor. Durch den Fokus auf eine robuste Simulationsplattform und effiziente Trainingsmethoden zeigt die Forschung, dass effektive Steuerungspolitiken entwickelt werden können, ohne auf umfangreiche reale Daten angewiesen zu sein.
Die Integration der Chrono- und ART/ATK-Plattformen fördert einen effizienteren Ansatz zur Erstellung und Testung autonomer Fahralgorithmen und verbessert das Potenzial für praktische Implementierungen in realen Umgebungen. Die laufende Arbeit zielt darauf ab, diese Methoden weiter zu verfeinern und ihre Anwendung auf verschiedene Arten von autonomen Fahrzeugen und Szenarien zu erkunden, wobei die Bedeutung von Echtzeitanpassungsfähigkeit und Lernen in dynamischen Bedingungen betont wird.
Titel: Zero-Shot Policy Transferability for the Control of a Scale Autonomous Vehicle
Zusammenfassung: We report on a study that employs an in-house developed simulation infrastructure to accomplish zero shot policy transferability for a control policy associated with a scale autonomous vehicle. We focus on implementing policies that require no real world data to be trained (Zero-Shot Transfer), and are developed in-house as opposed to being validated by previous works. We do this by implementing a Neural Network (NN) controller that is trained only on a family of circular reference trajectories. The sensors used are RTK-GPS and IMU, the latter for providing heading. The NN controller is trained using either a human driver (via human in the loop simulation), or a Model Predictive Control (MPC) strategy. We demonstrate these two approaches in conjunction with two operation scenarios: the vehicle follows a waypoint-defined trajectory at constant speed; and the vehicle follows a speed profile that changes along the vehicle's waypoint-defined trajectory. The primary contribution of this work is the demonstration of Zero-Shot Transfer in conjunction with a novel feed-forward NN controller trained using a general purpose, in-house developed simulation platform.
Autoren: Harry Zhang, Stefan Caldararu, Sriram Ashokkumar, Ishaan Mahajan, Aaron Young, Alexis Ruiz, Huzaifa Unjhawala, Luning Bakke, Dan Negrut
Letzte Aktualisierung: 2023-09-18 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2309.09870
Quell-PDF: https://arxiv.org/pdf/2309.09870
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.