Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Robotik

Bi-Touch: Fortschrittliche Interaktion mit Dual-Arm-Robotern

Das Bi-Touch-System verbessert die Fähigkeit von Robotern, Objekte mit Berührung und Sicht zu manipulieren.

― 7 min Lesedauer


Bi-Touch-SystemBi-Touch-SystemrevolutioniertrobotergestütztePräzision durch taktile Rückmeldung.Neuer Dualarm-Roboter verbessert
Inhaltsverzeichnis

Roboter, die beide Arme nutzen können, sind echt nützlich, um grosse oder unhandliche Gegenstände zu bewegen. Aber ihnen das effektiv beizubringen, ist nicht einfach. Ein Bereich, der hilft, Roboter schlauer zu machen, ist das Tasten. Wenn man Tasten mit visuellen Infos kombiniert, können Roboter komplexe Aufgaben leichter erledigen. Dieses Projekt stellt ein Robotersystem namens Bi-Touch vor, das Feedback vom Tasten nutzt, um Aufgaben mit zwei Armen zu managen.

Der Bedarf an bimanualer Manipulation

Bimanuale Manipulation heisst, beide Hände für eine Aufgabe zu nutzen. Das machen Menschen ganz natürlich, und es kann auch für Roboter vorteilhaft sein. Wenn Roboter beide Arme nutzen können, können sie grössere Objekte besser handhaben und flexibler bewegen. Aber Systeme zu bauen, die es Robotern erlauben, beide Arme effektiv zu nutzen, ist ziemlich kompliziert. Die Technologie ist nicht nur teuer, sondern es ist auch eine Herausforderung herauszufinden, wie man diese Arme zusammenarbeiten lässt.

Das Bi-Touch-System

Das Bi-Touch-System besteht aus zwei industriellen Robotern, die nicht so teuer sind. Wir haben diese Arme mit speziellen Sensoren ausgestattet, die Tasten und Berührung erkennen können. Diese Sensoren helfen dem Roboter zu verstehen, wie viel Kraft er einsetzen soll, wenn er mit Objekten interagiert, was wichtig ist, um die Dinge stabil zu halten und Schäden zu vermeiden.

Aufgaben für bimanuale Manipulation

Das Bi-Touch-System ist so designed, dass es drei Hauptarten von Aufgaben erledigen kann, die beide Arme erfordern. Diese Aufgaben nutzen die Fähigkeit des Roboters zu fühlen und zu erkennen:

  1. Bi-Pushing: Bei dieser Aufgabe nutzt der Roboter beide Arme, um ein grosses Objekt über eine Fläche zu bewegen. Das Ziel ist, das Objekt an einen bestimmten Ort zu schieben.

  2. Bi-Reorienting: Diese Aufgabe beinhaltet, ein Objekt zu einem bestimmten Winkel zu drehen, ohne es anzuheben. Der Roboter muss das Objekt stabil halten, während er seine Position ändert.

  3. Bi-Gathering: Bei dieser Aufgabe muss der Roboter zwei Objekte aufeinander zubewegen, bis sie sich berühren. Das ist ein bisschen knifflig, weil sich das Ziel bewegt, während die Objekte geschoben werden.

Lernen durch Feedback

Um dem Roboter beizubringen, wie man diese Aufgaben erfüllt, nutzen wir eine Methode namens Deep Reinforcement Learning. Das ist eine Art von KI, die es Robotern erlaubt, aus ihren Aktionen zu lernen und sich im Laufe der Zeit zu verbessern. Der Roboter erhält Belohnungen, wenn er Fortschritte bei der Erledigung einer Aufgabe macht. Durch dieses Feedback lernt der Roboter die besten Aktionen in verschiedenen Situationen.

Beim Bi-Pushing erhält der Roboter Belohnungen dafür, dass er das Objekt erfolgreich näher an die Zielposition bewegt. Beim Bi-Reorienting ist die Belohnung davon abhängig, wie gut der Roboter die Position des Objekts beim Drehen zum Zielwinkel hält. Beim Bi-Gathering steigen die Belohnungen, je näher sich die beiden Objekte kommen.

Herausforderungen

Bei der Schulung des Bi-Touch-Systems sind wir auf einige Herausforderungen gestossen. Ein grosses Problem war die Lücke zwischen dem, was der Roboter in Simulationen lernt, und dem, was er in der realen Welt erlebt. Manchmal drückte ein Roboter, der in einer Computersimulation trainiert wurde, ein Objekt unnötig fest, was zu potenziellen Schäden führte.

Um das zu beheben, haben wir Anpassungen in der Simulation vorgenommen, wie zum Beispiel, wie der Roboter mit den Objekten interagiert, um empfindlicher auf Druck zu reagieren.

Die Bedeutung des taktilen Feedbacks

Tasten ist entscheidend für Aufgaben, die die Interaktion mit Objekten beinhalten. Allein das Sehen reicht oft nicht aus, besonders wenn die Form oder Textur des Objekts es schwer macht, es klar zu sehen. Die taktilen Sensoren geben den Robotern Informationen darüber, wie fest sie greifen und ob sie kurz davor sind, ein Objekt fallen zu lassen oder zu beschädigen.

Taktile Rückmeldungen sind besonders wichtig für Aufgaben, die Präzision erfordern. Wenn ein Roboter zum Beispiel versucht, einen zerbrechlichen Gegenstand vorsichtig irgendwo abzulegen, muss er wissen, wie fest er drücken und wann er aufhören soll, basierend auf den Infos von seinen Sensoren.

Einrichtung des Dual-Arm-Systems

Das Bi-Touch-System besteht aus zwei Roboterarmen, die auf einem Tisch platziert sind, wo sie sich gegenseitig und die Objekte, die sie manipulieren, erreichen können. Jeder Arm hat am Ende einen taktilen Sensor, der wie ein menschlicher Finger funktioniert und notwendiges Feedback über den Kontakt zwischen dem Roboter und dem Objekt bietet.

Die Sensoren sind so konzipiert, dass sie erschwinglich sind, während sie trotzdem hochauflösendes Feedback liefern. Das bedeutet, sie können kleine Veränderungen erkennen, wenn der Roboter etwas berührt, was für feine Manipulationen hilfreich ist.

Der Lernrahmen

Der Lernprozess umfasst mehrere Schritte. Zuerst übt der Roboter in einer simulierten Umgebung, die mit einem Softwaretool namens Tactile Gym eingerichtet ist. Dort kann er verschiedene Aufgaben ausprobieren, ohne das Risiko, teure Geräte zu beschädigen. Er lernt, wie er auf das Feedback von den taktilen Sensoren reagieren soll, während er die Aufgaben ausführt.

Sobald der Roboter ein gewisses Leistungsniveau in der Simulation erreicht hat, übertragen wir dieses Wissen auf das realweltliche Robotersystem. Dieser Prozess wird als „sim-to-real“-Transfer bezeichnet und ist entscheidend dafür, dass der Roboter in realen Umgebungen gut performt.

Experimente und Ergebnisse

In unseren Experimenten haben wir getestet, wie gut das Bi-Touch-System die drei Aufgaben mit verschiedenen Objekten unterschiedlicher Formen, Grössen und Gewichte durchführen konnte. Für jede Aufgabe haben wir gemessen, wie genau der Roboter diese Objekte manipulieren konnte und wie schnell er die Aufgaben erledigen konnte.

Bi-Pushing Ergebnisse

Bei der Bi-Pushing-Aufgabe hat der Roboter gezeigt, dass er in der Lage ist, verschiedene Arten von Objekten effektiv mit beiden Armen zu bewegen. Er hat erfolgreich gelernt, die Gegenstände entlang eines vorher festgelegten Pfades zu schieben und dabei eine hohe Genauigkeit erreicht. Die Ergebnisse zeigten, dass der Roboter die Trajektorie, auf der er trainiert wurde, konstant folgen konnte.

Bi-Reorienting Ergebnisse

Bei der Bi-Reorienting-Aufgabe war der Roboter in der Lage, verschiedene Objekte zu drehen, während er sie an Ort und Stelle hielt. Auch hier zeigte er eine hohe Genauigkeitsrate, wenn es darum ging, die Objekte auf bestimmte Winkel zu orientieren. Der Roboter nutzte sein taktiles Feedback, um sicherzustellen, dass er die Objekte beim Ausführen der Aufgabe nicht quetschte oder beschädigte.

Bi-Gathering Ergebnisse

Bei der Bi-Gathering-Aufgabe stellte der Roboter sich mehr Komplexität, da er seine Aktionen an die Bewegungen der Objekte anpassen musste. Trotz dieser Anforderungen konnte er die Objekte wie gewünscht zusammenbringen. Wir haben eine neue Methode integriert, die dem Roboter Teilziele gab, damit er besser lernen konnte, wie er die Aufgabe handhabt, wenn die Situation pausiert oder sich ändert.

Diskussion

Das Bi-Touch-System hat sich als effektiv erwiesen, wenn es darum geht, Aufgaben, die Tasten erfordern, durchzuführen. Seine Fähigkeit, sowohl taktiles als auch propriozeptives Feedback zu nutzen, ermöglicht einen multidimensionalen Ansatz zur Problemlösung. Das ist besonders wichtig in realen Anwendungen, wo sich die Bedingungen schnell ändern können.

Während wir dieses System weiterentwickeln, können wir auch zusätzliche Aufgaben erkunden, die feinere Manipulationen erfordern. Derzeit ist der Roboter so eingerichtet, dass er Objekte anheben und manipulieren kann, ohne auf einem Tisch zu ruhen, was eine spannende Herausforderung darstellt.

Zukünftige Richtungen

Wenn wir nach vorne schauen, gibt es viele Möglichkeiten, das Bi-Touch-System zu verbessern. Zum Beispiel könnten wir die taktilen Sensoren verbessern, indem wir fortschrittlichere Versionen hinzufügen, die auch Scherkräfte messen können. Das könnte neue Möglichkeiten für Aufgaben eröffnen, die eine empfindlichere Kontrolle erfordern.

Ein weiterer Bereich der Erkundung ist, das Bi-Touch-System auf vielfältige Aufgaben anzuwenden, die Präzision erfordern. Bisher haben wir nur die Oberfläche unserer Aufgaben angeschnitten. Neue Anwendungen könnten alles von der Automatisierung in Lagerhäusern bis hin zu Hilfstechnologien für Menschen mit Mobilitätseinschränkungen umfassen.

Fazit

Zusammenfassend lässt sich sagen, dass das Bi-Touch-System einen bedeutenden Schritt in der Entwicklung von dual-arm Robotersystemen darstellt, die taktiles Feedback nutzen. Der Lernrahmen und die Experimente haben das Potenzial gezeigt, dass Roboter komplexe Aufgaben mit hoher Genauigkeit und Anpassungsfähigkeit ausführen können. Mit fortlaufender Forschung und Entwicklung zielen wir darauf ab, diese Technologie weiter zu verbessern, um Roboter noch fähiger und vielseitiger in den Aufgaben zu machen, die sie ausführen können.

Originalquelle

Titel: Bi-Touch: Bimanual Tactile Manipulation with Sim-to-Real Deep Reinforcement Learning

Zusammenfassung: Bimanual manipulation with tactile feedback will be key to human-level robot dexterity. However, this topic is less explored than single-arm settings, partly due to the availability of suitable hardware along with the complexity of designing effective controllers for tasks with relatively large state-action spaces. Here we introduce a dual-arm tactile robotic system (Bi-Touch) based on the Tactile Gym 2.0 setup that integrates two affordable industrial-level robot arms with low-cost high-resolution tactile sensors (TacTips). We present a suite of bimanual manipulation tasks tailored towards tactile feedback: bi-pushing, bi-reorienting and bi-gathering. To learn effective policies, we introduce appropriate reward functions for these tasks and propose a novel goal-update mechanism with deep reinforcement learning. We also apply these policies to real-world settings with a tactile sim-to-real approach. Our analysis highlights and addresses some challenges met during the sim-to-real application, e.g. the learned policy tended to squeeze an object in the bi-reorienting task due to the sim-to-real gap. Finally, we demonstrate the generalizability and robustness of this system by experimenting with different unseen objects with applied perturbations in the real world. Code and videos are available at https://sites.google.com/view/bi-touch/.

Autoren: Yijiong Lin, Alex Church, Max Yang, Haoran Li, John Lloyd, Dandan Zhang, Nathan F. Lepora

Letzte Aktualisierung: 2023-07-12 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2307.06423

Quell-PDF: https://arxiv.org/pdf/2307.06423

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel