Optimierung der robotischen Bewegungsplanung in komplexen Umgebungen
Forschung zeigt verbesserte Methoden für die Bewegungsplanung von Robotern in verschiedenen komplizierten Szenarien.
― 7 min Lesedauer
Inhaltsverzeichnis
- Bewegungsplanung auf 2D-Gelände
- Punktmasse-Navigation auf einem Hindernisgitter
- Bewegungsplanungs-Benchmark
- Benchmark-Vergleich bei Robotermanipulation
- Regulierung der Pfadlänge und dynamischer Bewegungen
- Roboterkollision als kontinuierliche Kosten
- Übertragung der Kollisionskosten vom Arbeitsbereich in den Konfigurationsraum
- Originalquelle
- Referenz Links
In diesem Abschnitt zeigen wir Ergebnisse, die beweisen, dass unsere Methode in verschiedenen simulierten Experimenten gut funktioniert, von einfacher 2D-Bewegungsplanung bis hin zu komplexeren Aufgaben für Roboterarme.
Bewegungsplanung auf 2D-Gelände
Die ersten Experimente beinhalten die Optimierung von Wegen in einer zufälligen 2D-Landschaft. Das zeigen wir mit einer Abbildung. In dieser Landschaft sind Bereiche mit hohen Kosten, wie Hügel, in dunklen Farben dargestellt, während kostengünstige Bereiche, wie Täler, in helleren Farben zu sehen sind.
Die Landschaft besteht aus mehreren zufälligen multivariaten Gauss-Verteilungen, die gemäss einer Halton-Sequenz angeordnet sind und ein Gauss-Mischmodell bilden. Die Wege werden mit natürlichen kubischen Splines und einer festgelegten Anzahl an Punkten, abgesehen von Start- und Endpunkten, erstellt.
Unser Ziel ist es, die besten Positionen für diese Punkte zu finden, um Wege vom Startpunkt zum Ziel zu kreieren, während wir teure Bereiche meiden und nicht zu lang werden. Um eine optimale Lösung zu finden, entwickeln wir eine Kostenfunktion, die die Länge des Weges und die Leichtigkeit der Bewegung berücksichtigt.
Jeder Weg, den wir erstellen, wird in 100 Wegpunkten abgetastet, bevor wir ihn mit unserer Kostenfunktion überprüfen. Die Startpunkte für diese Wegpunkte sind zufällig festgelegt, und die letzten 20 Wege werden in der Abbildung anhand von drei verschiedenen Optimierungsmethoden gezeigt.
Die mit Batch Gradient Descent (BGD) gefundenen Wege zeigen, dass sie zu zwei Hauptlösungen mit ähnlichen Kosten konvergieren. Die Ergebnisse der anderen Methode zeigen mehr Vielfalt, erfassten jedoch eine Lösung von BGD nicht. Wenn mehrere Wege in einem kostengünstigen Bereich zusammentreffen, werden die Knoten auseinander gedrängt, was zu weniger optimalen Ergebnissen führt. Im Gegensatz dazu zeigen die Wege aus unserem Ansatz mehr Vielfalt und können in engen Räumen koexistieren, was zu direkteren Wegen führt als bei der anderen Methode.
Punktmasse-Navigation auf einem Hindernisgitter
Als nächstes schauen wir uns die Aufgaben der Punktmasse-Navigation an. Wir vergleichen die Kosten und Schritte der verschiedenen Methoden in einer Tabelle. Eine Methode, CMA-ES, konnte keine der Aufgaben abschliessen, weshalb ihre Ergebnisse nicht enthalten sind.
Wenn wir die Navigationspfade plottieren, zeigen wir einen Zwischen Schritt der Navigationsaufgabe mit zwei Methoden. Die Farben im Plot zeigen den Ursprung jedes Weges an, während Standardbewegungsmuster in lila dargestellt sind. Die von unserer Methode erstellten Wege sind vielfältiger, was hilft, die Politiken zu aktualisieren.
Wir zielen darauf ab, die Vorteile einer bestimmten Art von Steuerung mit der Signature Kernel Model Predictive Control (MPC) zu zeigen. Dazu simulieren wir einen Roboter, der von Start bis Ziel durch ein Hindernisgitter navigiert.
Die Bewegung des Roboters wird mit einem doppelten Integratorsystem modelliert, wobei wir seine Bewegung durch Anwendung von Kraft steuern können. Wir verwenden die gleiche Kostenfunktion wie in früheren Arbeiten, die Positionsfehler und Strafen für Kollisionen berücksichtigt.
Bewegungsplanungs-Benchmark
Unsere Benchmark-Ergebnisse spiegeln Durchschnitte aus mehreren Durchläufen über unterschiedliche Szenarien wider. Wir zeigen Mittelwerte und Standardabweichungen für verschiedene Anfragen. Die besten Ergebnisse werden hervorgehoben und zeigen die niedrigsten Kosten für gefundene Wege.
In diesem kontrollierten Szenario ordnen wir Hindernisse in einem Gitter an, um mehrere Wege zu schaffen. Der Simulator überprüft Kollisionen basierend auf dem Zustand des Roboters und verhindert Bewegungen, wenn eine Kollision festgestellt wird. Zudem werden Barrieren installiert, um sicherzustellen, dass der Roboter nicht einfach um die Hindernisse herumgeht.
Da die Kostenfunktion nicht glatt ist, müssen wir approximative Gradienten durch Sampling berechnen. In diesem Experiment stellt jeder Weg eine Steuerungspolitik dar, die optimiert wird. Wir erzeugen Gradienten, indem wir Richtlinien überprüfen und Rollouts auswerten.
CMA-ES erkundet immer nur eine Lösung zur Zeit. Um es vergleichbar zu machen, erhöhen wir die Anzahl der Proben, die es in jedem Schritt überprüft. Diese Methode integriert auch vorgegebene Basissteuerungen, die während der Optimierung nicht verändert werden.
Die Ergebnisse zeigen, dass unsere Methode zu niedrigeren Kosten und weniger Zeitstufen führt, um Ziele im Vergleich zu anderen zu erreichen. Die Natur des Problems beschränkt, wie viele Iterationen wir durchführen können, was es CMA-ES erschwert, da es in allen Tests Schwierigkeiten hatte.
Benchmark-Vergleich bei Robotermanipulation
Wir testen unsere Methode bei robotergestützten Manipulationsaufgaben, die aus einer bestimmten Menge von Szenarien generiert werden. Jedes Szenario umfasst zufällig platzierte Hindernisse und besteht darin, den Roboterarm von seiner Startposition in eine Zielkonfiguration zu bewegen.
Wir generieren mehrere Anfragen für jede Szene und optimieren mit mehreren zufälligen Seeds für Konsistenz. Der in diesem Fall verwendete Roboter hat sieben Gelenke.
Die Kostenfunktion sorgt dafür, dass die Wege glatt, kollision-sicher und mit minimaler Bewegung für den Endeffektor des Roboters sind.
Bei der Bewegungsplanung optimieren wir direkt im Gelenkraum, was die Suche nach möglichen Bewegungen vereinfacht. Um glatte Bewegungen zu erzeugen, erstellen wir Wege mit natürlichen kubischen Splines und mehreren Zwischenpunkten zwischen Start und Ende.
Regulierung der Pfadlänge und dynamischer Bewegungen
Während die Verwendung von Splines hilft, glatte Wege zu erstellen, garantiert das keine flüssigen Bewegungen für den Roboter. Zum Beispiel, selbst wenn ein Weg glatt aussieht, kann der Roboter trotzdem ungeschickt bewegen, was zu abrupten Beschleunigungen und Verzögerungen führt.
Um diese plötzlichen Bewegungen zu vermeiden, fügen wir einen neuen Term zur Kostenfunktion hinzu, der grosse Sprünge zwischen Roboterkonfigurationen entmutigt. Dies berücksichtigt die Anzahl der Punkte, die entlang des Weges gewählt werden, und gibt bestimmten Gelenken mehr Gewicht.
Ausserdem fügen wir einen letzten Term zur Kostenfunktion hinzu, der darauf abzielt, die Trajektorienlänge des Endeffektors zu minimieren. Unsere gesamte Kostenfunktion kombiniert Strafen für die Pfadlänge, Dynamik und Kollisionen.
Der Optimierungsprozess läuft insgesamt 500 Iterationen, wobei Anpassungen an den Kräften, die auf die Knoten wirken, vorgenommen werden, damit die Wege besser konvergieren können. Die Ergebnisse spiegeln eine verbesserte Leistung unter verschiedenen Bedingungen wider.
Roboterkollision als kontinuierliche Kosten
Typischerweise ist die Überprüfung von Kollisionen eine einfache Ja-oder-Nein-Antwort, die sich nicht gut für die Optimierung eignet. Um einen glatteren Prozess zur Kollisionserkennung zu schaffen, verwenden wir kontinuierliche Belegungsraster.
Diese Raster stellen Bereiche dar, in denen der Roboter arbeitet, als ein Gitter von Zellen dar, wobei jede Zelle darstellt, ob ein Hindernis vorhanden ist oder nicht. Diese Methode ist jedoch nicht glatt, weshalb wir eine kontinuierliche Version dieser Belegungs-Karten entwickeln.
Dazu setzen wir ein neuronales Netzwerk ein, das lernt vorherzusagen, ob eine spezifische Konfiguration für den Roboter belegt ist oder nicht. Dieses Netzwerk ist schnell und kann die notwendigen Informationen bereitstellen, um bei grossen Mengen an Koordinaten während der Planung zu helfen.
Um das Netzwerk zu trainieren, nehmen wir Punkte aus Sensordaten und kategorisieren sie in belegt oder nicht. Das Netzwerk lernt dann, eine Wahrscheinlichkeit abzugeben, die als Kostenfunktion für die Kollisionserkennung fungiert.
Für die Überprüfung von Selbstkollisionen folgen wir einem ähnlichen Prozess, wobei wir ein anderes neuronales Netzwerk verwenden, um die Wahrscheinlichkeit von Kollisionen zwischen den Gelenken des Roboters vorherzusagen. Wir trainieren dieses Netzwerk mit zufälligen Konfigurationen und bestehenden Überprüfungen, die von der Programmieroberfläche des Roboters bereitgestellt werden.
Übertragung der Kollisionskosten vom Arbeitsbereich in den Konfigurationsraum
Es ist wichtig, den Arbeitsbereich mit der Bewegung des Roboters im Gelenkraum zu verknüpfen. Wir nehmen an, dass die Bewegung des Roboters im Gelenkraum definiert ist, und wir müssen Kostendaten aus dem Arbeitsbereich in diesen Raum ziehen.
Die Kostenfunktionen, die wir entwerfen, müssen das Verhalten des Roboters prägen. Wir definieren Gelenkkonfigurationen, die die Positionen jedes Gelenks im Roboter darstellen.
Wir beginnen damit, Punkte auf dem Körper des Roboters festzulegen, die jeweils mit ihrer Position im Arbeitsbereich durch eine bestimmte Funktion verbunden sind. Der nächste Schritt besteht darin, zu berechnen, wie die Kosten im Arbeitsbereich die Bewegung im Gelenkraum beeinflussen.
Durch das Extrahieren von Kosten-Gradianten aus dem Arbeitsbereich können wir die Trajektorie im Gelenkraum basierend auf potenziellen Kosten, die im Arbeitsbereich gefunden wurden, anpassen. Dieser Prozess hilft, glattere und effizientere Bewegungen für den Roboter zu erreichen, während Hindernisse vermieden werden.
Der gesamte Ansatz verbessert die Leistung des Roboters in verschiedenen Aufgaben und sorgt für sicherere und effektivere Wege während des Betriebs. Die beschriebenen Techniken ermöglichen nicht nur glatte Wege, sondern auch eine bessere Anpassungsfähigkeit an dynamische Umgebungen.
Titel: Path Signatures for Diversity in Probabilistic Trajectory Optimisation
Zusammenfassung: Motion planning can be cast as a trajectory optimisation problem where a cost is minimised as a function of the trajectory being generated. In complex environments with several obstacles and complicated geometry, this optimisation problem is usually difficult to solve and prone to local minima. However, recent advancements in computing hardware allow for parallel trajectory optimisation where multiple solutions are obtained simultaneously, each initialised from a different starting point. Unfortunately, without a strategy preventing two solutions to collapse on each other, naive parallel optimisation can suffer from mode collapse diminishing the efficiency of the approach and the likelihood of finding a global solution. In this paper we leverage on recent advances in the theory of rough paths to devise an algorithm for parallel trajectory optimisation that promotes diversity over the range of solutions, therefore avoiding mode collapses and achieving better global properties. Our approach builds on path signatures and Hilbert space representations of trajectories, and connects parallel variational inference for trajectory estimation with diversity promoting kernels. We empirically demonstrate that this strategy achieves lower average costs than competing alternatives on a range of problems, from 2D navigation to robotic manipulators operating in cluttered environments.
Autoren: Lucas Barcelos, Tin Lai, Rafael Oliveira, Paulo Borges, Fabio Ramos
Letzte Aktualisierung: 2023-08-08 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2308.04071
Quell-PDF: https://arxiv.org/pdf/2308.04071
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.