Simple Science

La science de pointe expliquée simplement

# Informatique# Robotique# Apprentissage automatique

Faire avancer la locomotion des robots humanoïdes grâce à l'apprentissage

Les robots humanoïdes apprennent à marcher mieux grâce à des techniques avancées d'apprentissage automatique.

― 6 min lire


Des robots humanoïdesDes robots humanoïdesapprennent à marchertechniques d'apprentissage avancées.locomotion des robots grâce à desDe nouvelles méthodes améliorent la
Table des matières

Les robots humanoïdes sont des machines conçues pour marcher comme des humains. Ils rencontrent pas mal de défis quand il s’agit de se déplacer dans des situations réelles. Cet article parle d'une nouvelle façon de faire marcher les robots humanoïdes mieux en utilisant une méthode d'apprentissage basée sur quelque chose appelé Transformers. On se concentre sur la façon dont ces robots peuvent apprendre à marcher dans différents environnements sans avoir besoin de beaucoup d'aide humaine.

Qu'est-ce que la locomotion humanoïde ?

La locomotion humanoïde fait référence à la façon dont des robots comme Digit se déplacent. Ce mouvement n'est pas facile parce que les robots doivent s'adapter à différents terrains, porter des objets et gérer des forces inattendues. Les méthodes traditionnelles pour faire marcher les robots utilisent souvent des maths complexes et des chemins prédéfinis. Cependant, les méthodes plus récentes se concentrent sur le fait de laisser les robots apprendre de différentes situations.

La nouvelle approche basée sur l'apprentissage

La nouvelle méthode pour faire bouger les robots implique d'utiliser un modèle Transformer, qui est un type spécial de modèle d'apprentissage automatique. Au lieu de se fier à des chemins ou règles prédéfinis, ce modèle apprend à prédire les actions futures en se basant sur des mouvements passés. En utilisant beaucoup de données provenant de différents environnements simulés, le robot peut apprendre à marcher dans le monde réel sans avoir besoin de réentraînement.

Comment le robot apprend

Quand le robot est entraîné, il reçoit différents ordres de marche dans divers environnements simulés. Ces environnements changent en fonction de la texture du sol, des pentes et des obstacles. Le robot apprend à s'adapter à ces changements et peut finalement bien performer même dans des conditions inconnues. Cet entraînement se fait sans chemins fixés ou enregistrements d'actions précédentes, ce qui permet au robot de découvrir les choses par lui-même.

Tester le robot

Pour tester l’efficacité de cette nouvelle approche, le robot Digit a été soumis à divers défis pour voir à quel point il avait appris à marcher dans le monde réel. Le robot a été évalué sur différents terrains et tout en portant des charges de différentes formes et poids. Les tests incluaient des déplacements sur des surfaces plates, des sols rugueux et des pentes.

Gérer les perturbations externes

Une qualité importante pour un robot qui marche est sa capacité à s’adapter aux perturbations. Le robot a été testé en portant des objets comme des sacs, ce qui a changé son équilibre. Pendant ces tests, le robot a réussi à ajuster ses mouvements pour maintenir sa stabilité.

Dans d'autres scénarios, le robot a fait face à des poussées ou tirages inattendus, comme être touché avec un bâton ou recevoir une balle. Dans tous ces cas, le robot a pu rapidement ajuster ses actions pour éviter de tomber.

S'adapter à différents terrains

Un robot dans le monde réel doit aussi être capable de marcher sur différents types de surfaces. Le robot Digit a été testé sur des surfaces avec différents niveaux de friction et de rugosité. Il a bien marché sur des sols lisses, mais a eu plus de mal sur des surfaces glissantes. Malgré cela, il a quand même réussi à accomplir les tâches qui lui étaient assignées.

Le robot a également fait face à des défis comme marcher sur des surfaces couvertes de câbles ou d'objets irréguliers comme du papier bulle. Les tests ont montré qu'il pouvait naviguer dans ces situations délicates mieux que prévu.

Monter des escaliers et gérer des pannes

Lors de tests supplémentaires, le robot a été amené à grimper de petites marches, ce qu'il n'avait pas pratiqué auparavant. Au début, il a eu du mal, mais il a rapidement appris à lever ses jambes plus haut lors de la deuxième tentative, montrant sa capacité à s’adapter.

De plus, le robot a été testé dans un scénario simulé où un moteur du genou tombait en panne. Le robot a réussi à ajuster rapidement ses mouvements, ce qui l'a aidé à se stabiliser malgré la panne. Cette capacité à faire des ajustements rapides montre que le robot peut gérer des problèmes sans avoir besoin de guider constamment.

Émergence du comportement de balancement des bras

Un comportement intéressant noté pendant le mouvement du robot a été l'émergence d'un balancement des bras qui imitait la marche humaine. Ce mouvement des bras a aidé à l'équilibre et à l'efficacité énergétique, ce qui est un aspect clé de la façon dont les humains marchent. Il n'a pas été explicitement instruit de balancer ses bras ; ce comportement s'est développé naturellement à mesure que le robot apprenait à mieux marcher.

Défis persistants et améliorations futures

Bien que le robot ait démontré des capacités impressionnantes, il y avait encore des domaines à améliorer. Par exemple, ses mouvements étaient parfois irréguliers et il ne suivait pas toujours parfaitement ses ordres. Ces problèmes pouvaient mener à de légères différences dans ses mouvements d'un côté à l'autre.

Un autre problème était que sous des perturbations extrêmes, comme être tiré fortement par derrière, le robot perdait parfois sa stabilité et tombait. Les travaux futurs visent à résoudre ces défis, en veillant à ce que le robot puisse gérer des situations plus difficiles.

Les techniques de simulation actuelles ont aussi des limites, notamment lorsqu'il s'agit de la structure complexe du robot. De meilleures simulations pourraient améliorer l'entraînement et la performance du robot.

Conclusion

Cette méthode basée sur l'apprentissage offre une nouvelle approche prometteuse pour améliorer la façon dont les robots humanoïdes marchent. L'adaptabilité montrée par le robot Digit met en valeur le potentiel des robots à apprendre et à améliorer leurs mouvements. Au fur et à mesure que la recherche avance, l'objectif est de créer des robots encore plus capables et fiables qui peuvent interagir de manière sûre et efficace avec les humains et leur environnement.

En utilisant les Transformers de cette nouvelle manière, on pose les bases d'un avenir où les robots humanoïdes peuvent marcher plus naturellement et gérer divers défis du monde réel avec aisance. Avec des avancées et des recherches supplémentaires, on espère voir des développements encore plus remarquables dans la locomotion humanoïde.

Source originale

Titre: Real-World Humanoid Locomotion with Reinforcement Learning

Résumé: Humanoid robots that can autonomously operate in diverse environments have the potential to help address labour shortages in factories, assist elderly at homes, and colonize new planets. While classical controllers for humanoid robots have shown impressive results in a number of settings, they are challenging to generalize and adapt to new environments. Here, we present a fully learning-based approach for real-world humanoid locomotion. Our controller is a causal transformer that takes the history of proprioceptive observations and actions as input and predicts the next action. We hypothesize that the observation-action history contains useful information about the world that a powerful transformer model can use to adapt its behavior in-context, without updating its weights. We train our model with large-scale model-free reinforcement learning on an ensemble of randomized environments in simulation and deploy it to the real world zero-shot. Our controller can walk over various outdoor terrains, is robust to external disturbances, and can adapt in context.

Auteurs: Ilija Radosavovic, Tete Xiao, Bike Zhang, Trevor Darrell, Jitendra Malik, Koushil Sreenath

Dernière mise à jour: 2023-12-14 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.03381

Source PDF: https://arxiv.org/pdf/2303.03381

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires