四足ロボットのジャンプ技術の進歩
新しい方法で四足ロボットがいろんな方向にうまくジャンプすることを教えるんだ。
― 1 分で読む
ジャンプは脚付きロボットにとって重要なスキルだよ。これがあると、大きな隙間や急な高さの変化がある場所を越えることができる。最近の進歩でロボットは速くて信頼性が増したけど、歩くことにばかり注目してきた。ジャンプはまだ難しいタスクで、ロボットは足の位置や空中での動きの変化に対処しなきゃいけないからね。この記事では、四足ロボットがもっと良くジャンプできる新しい方法について話すよ。
ジャンプの課題
ロボットがジャンプすると、すべての足が同時に地面を離れて、地面に触れていないフェーズができる。このフェーズのおかげで、ロボットは止まらずに大きな距離をカバーできる。これは厳しい地形を乗り越えるのに重要なんだ。今ある技術は主に歩行に対応しているから、ロボットは長いジャンプのために十分に訓練されていないんだ。伝統的には、良いジャンププランを作るのは時間と手間がかかる。
我々のアプローチ
これらの課題を克服するために、四足ロボットが多方向に、さまざまな距離でジャンプする方法を教えるスマートなシステムを作ったよ。このシステムは、最適制御と強化学習の2つの主要な方法を組み合わせている。
スタンスコントローラー:この部分がロボットがジャンプする時の体の保持方法を計算する。シンプルに設計されたコントローラーと学習した部分を組み合わせて安定性を向上させるんだ。シンプルなコントローラーが学習プロセスを始めて、ロボットが早く、ノイズが少なく学べるように助ける。
全身コントローラー:この部分はロボットの体全体の動きを担当する。スタンスコントローラーからの指令をロボットのモーターのアクションに変換する。
シミュレーション環境で訓練した後、この方法は実際のロボットに直接使えるようになるんだ。ジャンプのスタイルも多様で、最大50センチの高さ、60センチ前方、さらには空中で90度のターンをすることもできるよ。
ジャンプの利点
ジャンプは、脚付きロボットが大きな隙間を超えて、高さの変化を効果的にナビゲートできるようにする。歩く時は足が地面に残るけど、ジャンプはロボットが地面に接触せずに距離を移動できるようにする。これって岩だらけの場所や不均一な場所では特に役立つんだ。
制御と学習の組み合わせ
ロボットがうまくジャンプするためには、従来の制御方法と新しい学習戦略を組み合わせたよ。現在の戦略はロボットの動きを単純なモデルで仮定しているけど、これは歩行には合うけど、ジャンプみたいな複雑な動きには通用しない。ウチの方法は、ロボットが空中での急な変化にもより良く反応できるようにする。
スタンスコントローラーはこのシステムにおいて重要な役割を果たす。加速度コントローラーと学習したポリシーからの出力を融合して、ジャンプに必要な体の位置を計算する。加速度コントローラーから始めることで、よりクリーンな訓練プロセスを作り、ジャンプ性能が向上するんだ。
シミュレーションでの訓練
ウチのシステムは、Go1四足ロボットのシミュレーション版を使って訓練した。訓練中、このフレームワークはさまざまな方向に連続して正確にジャンプすることを学んだ。システムは異なる着地ターゲットに基づいてリアルタイムで調整もできる。
各訓練セッションでは、特定のジャンプタスクを設定した。ロボットはさまざまな方向にジャンプする練習をして、新しい状況に素早く適応できるように助けるんだ。
実世界でのパフォーマンス
訓練後、ウチのシステムを実際のロボットに移行して、追加の調整なしで成功したよ。Go1ロボットは多くの高いジャンプをさまざまな方向で完了した。リアルなテストでは、ロボットは印象的な高さと距離に達した。
実際のパフォーマンスはシミュレーションより少し低かったけど、これは現実環境の未考慮な要因、例えばモーターの制限による普通の現象だよ。
方法の比較
ウチのアプローチが機能することを確認するために、他の訓練方法とテストした。学習したポリシーか加速度コントローラーのどちらかを外して、どれだけシステムがパフォーマンスできるかを見たんだ。それから、モーターコマンドを直接出力する一般的な強化学習アプローチも試した。
分析の結果、スタンスコントローラーと学習したポリシーを使ったシステムが他の方法より常に優れていることがわかった。ジャンプが高くなるだけじゃなく、ジャンプ中の安定性も向上したんだ。
結論
ジャンプは脚付きロボットにとって重要なスキルだ。ウチの革新的なアプローチは、従来の制御技術と先進的な学習方法を組み合わせて、ロボットに連続的に効果的にジャンプする方法を教えている。訓練されたシステムはシミュレーションから実生活に直接移行し、あらゆる方向と高さでジャンプできるようにするんだ。
今のところ、ウチの取り組みは一種類のジャンプ動作をサポートしているけど、もっとバリエーションを加えることでパフォーマンスが向上すると思ってる。将来の研究では、ロボットが周囲を感知する能力を持たせて、自分で厳しい地形をナビゲートできるようにすることを考えているよ。
未来の方向性
ロボットのジャンプ能力を最大化するために、バウンディングやギャロッピングのようなもっと多くのジャンプ動作を探求するつもりだ。感覚フィードバックを統合することで、ロボットが環境をよりよく理解し、いつどこでジャンプするかについてより良い決定を下せるようにするんだ。これで脚付きロボットがさまざまな厳しい環境で達成できる限界を押し上げることができるよ。
タイトル: Continuous Versatile Jumping Using Learned Action Residuals
概要: Jumping is essential for legged robots to traverse through difficult terrains. In this work, we propose a hierarchical framework that combines optimal control and reinforcement learning to learn continuous jumping motions for quadrupedal robots. The core of our framework is a stance controller, which combines a manually designed acceleration controller with a learned residual policy. As the acceleration controller warm starts policy for efficient training, the trained policy overcomes the limitation of the acceleration controller and improves the jumping stability. In addition, a low-level whole-body controller converts the body pose command from the stance controller to motor commands. After training in simulation, our framework can be deployed directly to the real robot, and perform versatile, continuous jumping motions, including omni-directional jumps at up to 50cm high, 60cm forward, and jump-turning at up to 90 degrees. Please visit our website for more results: https://sites.google.com/view/learning-to-jump.
著者: Yuxiang Yang, Xiangyun Meng, Wenhao Yu, Tingnan Zhang, Jie Tan, Byron Boots
最終更新: 2023-04-17 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2304.08663
ソースPDF: https://arxiv.org/pdf/2304.08663
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。