Présentation du Barkour Benchmark pour l'agilité des robots
Une nouvelle évaluation de parcours d'obstacles pour des robots quadrupèdes inspirée de l'agilité des chiens.
― 11 min lire
Table des matières
Les animaux ont développé différentes façons de se déplacer rapidement et avec Agilité, comme sprinter et sauter. Ça a amené les chercheurs à créer des robots qui peuvent imiter ces mouvements et gérer des environnements difficiles avec rapidité et contrôle. Cependant, il manque des tests standards pour évaluer à quel point ces robots sont agiles.
Pour remédier à ça, on a créé le benchmark Barkour, un parcours d'obstacles conçu pour évaluer l'agilité des robots à pattes. Inspiré des compétitions d'agilité canine, il comprend divers défis et utilise un système de chronométrage pour le scoring. Ce format incite les chercheurs à construire des systèmes qui non seulement se déplacent vite mais peuvent aussi le faire de manière flexible.
Pour établir de solides bases de performance, on a développé deux méthodes pour aborder le benchmark Barkour. La première méthode consiste à entraîner des compétences spécialisées via l'apprentissage par renforcement, où les robots apprennent à naviguer à travers différents obstacles. La deuxième méthode distille ces compétences spécialisées en une politique de Locomotion unifiée et flexible appelée Locomotion-Transformer. Cette approche permet au robot d'adapter ses mouvements en fonction de l'environnement qu'il détecte.
Avec un robot quadrupède sur mesure, on a découvert que nos méthodes pouvaient naviguer dans le parcours à peu près à la moitié de la vitesse d'un chien typique. On espère que notre travail soit un pas vers la création de robots qui possèdent l'agilité des animaux.
Setup Physique
Le parcours Barkour est conçu pour tenir dans une zone de 5 x 5, contenant quatre obstacles principaux : des poteaux de slalom, un A-frame, une planche de saut et des tables de pause. Le robot doit terminer le parcours en traversant ces défis de manière efficace.
On a vu une croissance dans le développement de robots inspirés par les mouvements animaux. Des exemples notables incluent l'ETH ANYmal, le MIT Mini Cheetah et le Boston Dynamics Spot. Une question clé dans ce domaine est comment construire un contrôleur qui permet à ces robots d'agir comme un animal tout en naviguant à travers divers obstacles et terrains.
Malgré les avancées, un problème majeur en robotique est le manque de méthodes standards pour évaluer comment ces systèmes peuvent se déplacer. Souvent, les résultats sont présentés avec différentes méthodes, rendant les comparaisons difficiles. On propose de développer des métriques standardisées pour mesurer avec précision l'agilité robotique et créer un ensemble commun de tâches sur lesquelles tout le monde peut s'accorder.
Un bon benchmark pour le mouvement agile devrait être difficile mais réalisable, nécessitant une variété de mouvements basiques que les animaux de la vie réelle effectuent aussi.
Il existe déjà des benchmarks établis pour mesurer la performance animale, comme les compétitions d'agilité canine. Dans ces événements, les chiens courent à travers un parcours d'obstacles préétabli, affrontant des défis comme des sauts et des tunnels. La performance est évaluée en fonction de la vitesse et de la précision, avec des pénalités pour les erreurs.
Inspiré par ces compétitions, on présente le parcours d'obstacles Barkour, une configuration de parkour exigeante spécifiquement pour les robots quadrupèdes. Ce nouveau suite de benchmarks vise à évaluer avec précision l'agilité et la performance robotiques.
Aperçu de Barkour
Le benchmark Barkour se compose d'obstacles divers placés dans une zone compacte, conçue pour nécessiter une gamme de compétences de mouvement, telles que courir et sauter. Pour marquer des points, le robot doit compléter le parcours dans un temps spécifique, similaire aux compétitions d'agilité canine. Plus le robot finit le parcours rapidement, plus il reçoit de points.
Pour évaluer le benchmark Barkour, on a mis en place une simulation et deux méthodes basées sur l'apprentissage comme références pour la performance. La première méthode utilise des Politiques spécialisées formées pour surmonter des obstacles individuels. La seconde méthode fusionne ces politiques en une seule politique de locomotion générale qui peut gérer une variété de défis.
Nos contributions incluent l'établissement du benchmark Barkour pour évaluer l'agilité des robots quadrupèdes, l'introduction des deux méthodes pour résoudre le benchmark, et une analyse détaillée de la façon dont les politiques apprises se transfèrent de la simulation aux applications réelles.
Travaux Connus
Les benchmarks sont cruciaux pour faire avancer les techniques d'intelligence artificielle, tout comme ImageNet pour la vision par ordinateur. Bien que de nombreux efforts se soient concentrés sur le développement de nouveaux algorithmes et contrôleurs, peu ont travaillé à créer une méthode systématique pour évaluer l'agilité robotique.
Des études précédentes ont examiné des métriques mesurant différentes compétences, comme sauter et s'équilibrer, mais elles manquent souvent d'environnements standardisés qui permettent des comparaisons rapides. En incluant un parcours d'obstacles cohérent et une métrique de performance claire, Barkour vise à combler cette lacune.
La combinaison de l'apprentissage par renforcement avec d'autres techniques permet aux robots de naviguer sur des terrains inégaux avec stabilité. Les avancées en perception et vision aident aussi à améliorer l'adaptabilité de ces robots. Notre travail s'appuie sur les découvertes précédentes, mettant l'accent sur l'agilité et la capacité à effectuer plusieurs compétences.
Alors que certaines recherches se sont concentrées sur la vitesse, nous priorisons un mélange de maniabilité et de vitesse sur des terrains complexes. Nos méthodes visent à réaliser une variété de mouvements agiles, permettant aux robots d'effectuer plusieurs tâches de manière cohérente.
Conception du Parcours Barkour
Le parcours Barkour se compose de quatre obstacles majeurs : des tables de pause, des poteaux de slalom, un A-frame et un grand saut. La conception vise à tester l'agilité et la précision d'un robot, nécessitant qu'il effectue différents mouvements pour naviguer dans le parcours avec succès.
En commençant par la table de pause initiale, le robot doit slalomer à travers une série de poteaux, grimper l'A-frame, sauter à travers le grand saut, et enfin atteindre la table de fin. Chaque obstacle teste des compétences différentes, et les compléter rapidement est vital pour un bon score.
Scoring dans Barkour
Le score d'agilité dans Barkour mesure à quelle vitesse un robot peut compléter le parcours d'obstacles avec succès. Le score est basé sur le temps, avec des déductions pour tout obstacle échoué ou sauté et des pénalités pour avoir dépassé le temps limite.
Le temps accordé est calculé en fonction de la performance attendue d'un chien dans une compétition comparable. Dans Barkour, les robots peuvent gagner un score maximum en terminant le parcours rapidement et sans erreurs.
En gardant le système de scoring simple, on vise à ce qu'il soit facilement adopté tant dans les simulations que dans les essais réels, garantissant une évaluation équitable des différentes conceptions et approches robotiques.
Solutions de Base
Pour assurer de solides benchmarks pour le parcours Barkour, on a développé deux solutions de base pour la locomotion des robots. La première consiste à former des politiques spécialisées pour diverses compétences nécessaires pour surmonter les obstacles. La seconde distille ces compétences en une politique généraliste nommée Locomotion-Transformer.
Notre objectif est de démontrer que l'utilisation du benchmark Barkour peut faire progresser les techniques de contrôle pour les robots agiles. En établissant ces solutions de base, on construit une fondation pour de futurs travaux axés sur l'amélioration de l'agilité robotique.
Apprentissage de Politique Spécialisée
La première base entraîne trois politiques spécialisées qui couvrent les compétences essentielles nécessaires pour Barkour : marcher sur un terrain inégal, grimper des pentes, et sauter. Chaque politique est conçue pour gérer des tâches spécifiques, permettant au robot d'exceller aux défis posés par le parcours.
Pour résoudre ces tâches, le robot utilise diverses observations et actions, qui sont soigneusement ajustées pour s'adapter à chaque obstacle. Cela permet un entraînement approfondi et une évaluation efficace de la performance dans le benchmark Barkour.
Politique de Locomotion-Transformer Généraliste
La seconde base vise à créer une politique généraliste unique qui peut gérer tous les défis du parcours Barkour. Cette approche simplifie la navigation en utilisant une politique distillée qui peut passer en douceur d'une compétence à une autre sans avoir besoin de changer entre différentes politiques spécialisées.
Cette méthode permet une plus grande adaptabilité et flexibilité dans les mouvements du robot, lui permettant de s'attaquer à divers obstacles sans problème pendant une course.
Matériel Robot
Pour tester pleinement le benchmark Barkour et ses effets sur l'agilité des robots, on a développé un robot quadrupède spécifique. Ce robot est conçu pour imiter la taille et les capacités des quadrupèdes réels, ce qui nous aide à évaluer à quel point il peut performer dans ces conditions difficiles.
On a utilisé divers composants, y compris des moteurs spécifiques pour contrôler les mouvements des membres, des capteurs pour suivre la position, et des méthodes pour contrôler le robot pendant les défis. Ce setup matériel est crucial pour collecter des données sur la performance des différentes politiques et améliorer l'agilité du robot.
Expériences et Discussions
On évalue la performance des politiques spécialisées et généralistes dans le benchmark Barkour. Nos principales questions se concentrent sur la mesure où Barkour est un indicateur efficace d'agilité, la manière dont les cadres proposés se comparent à l'agilité animale, et l'importance des choix de conception faits pendant l'entraînement des politiques individuelles.
Les résultats montrent que le benchmark défie effectivement les robots à démontrer leur agilité, révélant des domaines à améliorer dans les approches matérielles et logicielles.
Perspectives des Expériences
Lors de nos évaluations, la capacité du robot à naviguer dans le parcours Barkour a été testée plusieurs fois. On a observé qu'utiliser des politiques spécialisées a permis de compléter le parcours avec succès, bien qu'avec des limitations en vitesse et en maniabilité.
On a trouvé que bien que le robot ait eu du mal avec certains éléments, il a tout de même réussi à effectuer de nombreuses tâches avec un bon taux de réussite. Cela a mené à des idées précieuses sur l'efficacité de nos méthodes d'entraînement et le potentiel d'amélioration de l'agilité globale des robots à pattes.
La comparaison entre la performance du robot et celle des vrais chiens a mis en lumière d'importants domaines à améliorer. Les chiens ont constamment performé plus vite et étaient plus agiles que le robot, indiquant la nécessité d'un développement supplémentaire.
Directions Futures
Bien que notre travail ait établi une base solide pour le benchmarking de l'agilité des robots quadrupèdes, il reste encore beaucoup à faire. Le benchmark Barkour n'est pas entièrement résolu, car les robots sont encore en retard par rapport à l'agilité des animaux réels.
Les futures directions de recherche incluent l'utilisation seulement de capteurs embarqués plutôt que d'informations privilégiées, le test de divers designs de robots et modifications matérielles, et l'exploration de réglages interactifs similaires aux événements d'agilité canine réels.
En continuant à affiner le benchmark Barkour et ses méthodes, on espère faire progresser le domaine de la robotique et aider au développement de robots plus agiles et capables.
Conclusion
On a introduit Barkour comme benchmark pour évaluer l'agilité des robots quadrupèdes. En s'inspirant des compétitions d'agilité canine, ce benchmark permet un mécanisme de scoring clair et simple basé sur diverses compétences nécessaires pour naviguer dans le parcours.
À travers nos deux solutions de base, on a démontré qu'il est possible pour les robots d'apprendre des mouvements agiles efficacement. Bien que nos méthodes montrent du potentiel, l'écart entre l'agilité robotique et animale souligne l'importance de la recherche continue dans ce domaine.
Titre: Barkour: Benchmarking Animal-level Agility with Quadruped Robots
Résumé: Animals have evolved various agile locomotion strategies, such as sprinting, leaping, and jumping. There is a growing interest in developing legged robots that move like their biological counterparts and show various agile skills to navigate complex environments quickly. Despite the interest, the field lacks systematic benchmarks to measure the performance of control policies and hardware in agility. We introduce the Barkour benchmark, an obstacle course to quantify agility for legged robots. Inspired by dog agility competitions, it consists of diverse obstacles and a time based scoring mechanism. This encourages researchers to develop controllers that not only move fast, but do so in a controllable and versatile way. To set strong baselines, we present two methods for tackling the benchmark. In the first approach, we train specialist locomotion skills using on-policy reinforcement learning methods and combine them with a high-level navigation controller. In the second approach, we distill the specialist skills into a Transformer-based generalist locomotion policy, named Locomotion-Transformer, that can handle various terrains and adjust the robot's gait based on the perceived environment and robot states. Using a custom-built quadruped robot, we demonstrate that our method can complete the course at half the speed of a dog. We hope that our work represents a step towards creating controllers that enable robots to reach animal-level agility.
Auteurs: Ken Caluwaerts, Atil Iscen, J. Chase Kew, Wenhao Yu, Tingnan Zhang, Daniel Freeman, Kuang-Huei Lee, Lisa Lee, Stefano Saliceti, Vincent Zhuang, Nathan Batchelor, Steven Bohez, Federico Casarini, Jose Enrique Chen, Omar Cortes, Erwin Coumans, Adil Dostmohamed, Gabriel Dulac-Arnold, Alejandro Escontrela, Erik Frey, Roland Hafner, Deepali Jain, Bauyrjan Jyenis, Yuheng Kuang, Edward Lee, Linda Luu, Ofir Nachum, Ken Oslund, Jason Powell, Diego Reyes, Francesco Romano, Feresteh Sadeghi, Ron Sloat, Baruch Tabanpour, Daniel Zheng, Michael Neunert, Raia Hadsell, Nicolas Heess, Francesco Nori, Jeff Seto, Carolina Parada, Vikas Sindhwani, Vincent Vanhoucke, Jie Tan
Dernière mise à jour: 2023-05-23 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2305.14654
Source PDF: https://arxiv.org/pdf/2305.14654
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.