SMPLOlympicsの紹介:ヒューマノイドスポーツの新しいフロンティア
SMPLOlympicsは、人型がオリンピックスタイルのスポーツで競うためのシミュレーション環境を提供して、動きの学習を向上させるよ。
― 1 分で読む
目次
私たちは、ヒューマノイドがさまざまなオリンピック競技に参加できる環境のコレクション、SMPLOlympicsを紹介します。これらの環境は、バーチャルアスリートが競い合うことを可能にし、研究者が機械に人間のように動くことを教えるアルゴリズムをテストして改善する手助けをします。人間は長い間これらのスポーツをプレイしてきたため、うまく行うための情報がたくさんあります。私たちのヒューマノイドモデルは、グラフィックス分野の人気の人間ボディモデルと連携して作られていて、既存の人間の動きをバーチャルアスリートに適用しやすくしています。
SMPLOlympicsでは、ゴルフ、棒高跳び、走り高跳び、走り幅跳び、ハードルなどの個人競技と、卓球、テニス、フェンシング、ボクシング、サッカー、バスケットボールなどの競技スポーツを提供しています。人間のパフォーマンスから学んだ強力な動作と、ヒューマノイドを報酬するシンプルな方法を組み合わせることで、彼らの行動がどのように人間のスポーツプレイに似ているかを見ることができました。
これらのシミュレーションスポーツ環境を作るのは簡単じゃありません。過去の多くの試みは、基本的な歩行や走行タスクに主に焦点を当てており、ヒューマノイドが学ぶのが簡単です。しかし、これらの初期のシミュレーションは、スポーツの動きから生まれる複雑さや多様性を十分に活用していませんでしたが、そうすることでより面白く、先進的な行動が引き出せる可能性があります。
ヒューマノイドシミュレーションで作業する一つの重要な利点は、人間の動きをトレーニングに簡単に取得できることです。ヒューマノイドは人間に似ているので、彼らがどんな動きをしているのかを理解しやすいです。私たちは、動画やモーションキャプチャデータを使用して、バーチャルアスリートを改善するために必要な人間の動きを集めることができます。
この研究では、ヒューマノイドがオリンピック競技で競える多様なシミュレーション環境、SMPLOlympicsを紹介します。このコレクションは、ヒューマノイドに動きだけでなく、協調や意思決定にも挑戦を与えます。人気の人間モデルに合わせたヒューマノイドのデザインにより、人間の動きを直接シミュレーションに変換することができます。手の動きが重要な場合には、SMPL-Xヒューマノイドモデルを使用します。他のタスクにはSMPLモデルで十分です。
私たちのスポーツ環境は、個人競技と団体競技の両方に対応しており、評価やベンチマークのための幅広いプラットフォームを提供します。個人競技には、ゴルフ、棒高跳び、走り高跳び、走り幅跳び、ハードルがあります。団体競技では、卓球、テニス、フェンシング、ボクシングのような一対一のゲームや、サッカー、バスケットボールのようなチームゲームを含みます。成功を測りやすくするため、サッカーのペナルティキックや卓球、テニスのボールターゲットヒットのようなシンプルなタスクも用意しています。
人間の動きがパフォーマンスを向上させる方法を示すために、私たちは動画からモーションデータを抽出し、それをヒューマノイドに適用します。これにより、私たちのシミュレーションアスリートがより人間のように動く手助けをし、結果をよりリアルにします。また、最近の動作表現の進展がヒューマノイドの制御を学習を通じてどのように強化できるかも調査しました。
関連研究
シミュレーションヒューマイドスポーツ
シミュレーションヒューマノイドスポーツを使うことで、アニメーションを作成したり、これらのスポーツに対するより良い戦略を見つけるのに役立ちます。これまでの研究は、主にテニス、卓球、ボクシング、フェンシング、バスケットボール、サッカーなどの個人競技をシミュレーションで研究してきました。これらの研究は、利用可能なデータを使って人間の動きを真似ることを目的としていました。しかし、異なるヒューマノイドのデザインにより、人間の動きデータを効果的に統合するのが難しくなっています。私たちのSMPLOlympicsのアプローチは、統一された環境を作り出し、異なるスポーツ間で学習方法を簡単に比較できるようにします。
シミュレーション強化学習ベンチマーク
シミュレーションヒューマノイドは、リアルな人間のアクションに似ているため、知的な動きを研究する貴重な機会を提供します。現在のほとんどのベンチマークは、歩行や障害を乗り越えるようなシンプルなタスクに焦点を当てています。それに対して、SMPLOlympicsは、より敏捷な動きやチームワークを要求する競技スポーツの機会を提供します。これらの要素は非常に目立ち、明確なパフォーマンス測定を可能にします。
問題定義
ヒューマノイドの動きは、3D関節位置と向きを表す特定の方法を使用して説明します。この際、正確な制御のためにこれらの動作の速度も含めました。ジャベリンやサッカーボールのような物体が関与する場合、ヒューマノイドに対する移動をモニタリングします。
目標条件付き強化学習によるヒューマノイド制御
各スポーツは、目標条件付き強化学習を使って設定します。ポリシーは、スポーツ環境内でのヒューマノイドの行動を管理するように訓練されます。トレーニングは、状態、行動、動きの遷移、報酬などの要素を基に構成されています。この方法は、ヒューマノイドが指定されたスポーツタスクを実行するのを学ぶのに役立ちます。
SMPLOlympics: シミュレーテッドヒューマノイド用スポーツ環境
このセクションでは、SMPLOlympicsの各スポーツがどのように構成されているか、個人イベントからチーム活動までを詳しく説明します。また、どのように動画から人間の動きデータを収集するかについても触れます。各スポーツには独自の報酬設計があり、さらなる発展の出発点を作り出します。
シングルパーソンスポーツ
走り高跳び: 走り高跳びでは、ヒューマノイドが一定の高さに設置されたバーを越えてジャンプし、バーの後ろにある目標ポイントに到達する必要があります。バーは正式なオリンピック競技のように配置されています。目標に近づいたり、高くジャンプすることで報酬が与えられます。
走り幅跳び: 走り幅跳びでは、ヒューマノイドは20メートルの助走を取り、ジャンプする必要があります。ジャンプラインから飛び立つ必要があり、ジャンプの距離やジャンプ前の速度に応じて報酬が与えられます。
ハードル: ハードル競技では、ヒューマノイドが110メートルを走り十のハードルを越えます。ヒューマノイドは、ゴールラインに向かって走り、各ハードルをクリアすることで報酬を獲得します。ハードルの高さはランダムに調整され、さまざまな課題を生み出します。
ゴルフ: ヒューマノイドはゴルフクラブを使ってボールをターゲットに向かって打ちます。環境は実際の草地を模しており、ヒューマノイドはボールを前に打ったり、クラブとの接触、ボールをホールに入れることで報酬を得ます。
ジャベリン: ジャベリン競技では、関節のある指を持つヒューマノイドを使用します。ヒューマノイドの目標は、ジャベリンをできるだけ遠くに投げることで、ジャベリンを持ち、正確に投げ、投げるときの安定性を保つことで報酬が与えられます。
マルチパーソンスポーツ
テニス: 各ヒューマノイドはラケットを持ってボールを打ちます。ソロの練習セッションや、一対一の競争マッチがあります。ヒューマノイドは、ボールに近づき、正確に目標に向かって打つことで報酬を得ます。
卓球: テニスと同様に、ヒューマノイドは標準サイズのテーブルでパドルを使ってボールを打ちます。ソロタスクと競争タスクの両方があり、ヒューマノイドは成功したヒットに対して報酬を得ます。
フェンシング: フェンシングの試合では、各ヒューマノイドが剣を持っています。報酬は、対戦相手に向かい、近づき、ターゲットに接触することに与えられます。
ボクシング: ボクシングのセットアップでは、ヒューマノイドはリング内で彼らの強化された手を使って戦います。トレーニングはフェンシングに似ており、動きと接触に対して報酬が構成されています。
サッカー: サッカーでは、ヒューマノイドはペナルティキックやチームマッチに参加できます。ペナルティキックでは、ヒューマノイドがゴールにボールを蹴ることを試みます。チームプレイでは、チームメイトとの協力が奨励され、報酬が与えられます。
バスケットボール: この環境はバスケットボールコートを模していて、ヒューマノイドはボールをフープに投げ入れる必要があります。ヒューマノイドは足を使わずにボールを投げることを学びます。
競技スポーツでは、基本的なセルフプレイメカニズムを有効にし、2つのポリシーが対戦することで、各自の戦略を改善する手助けをします。
動画からの人間のデモンストレーション収集
人間の動きデモンストレーションを集めるために、動画から3D動作を再構築する高度な方法を利用しています。これらのシステムは、スポーツ放送のような動的な環境でも動きを追跡できます。収集したデータは、ヒューマノイドの動きを指導するために使用され、リアルで物理的に説得力のある動きを確保します。
実装の詳細
シミュレーションは特定の速度で動作する専門の環境内で行われます。使用されるヒューマノイドは特定の関節構造を持ち、その動きに対する詳細な測定があります。ヒューマノイドのトレーニングプロセスは、複雑なアルゴリズムを処理するために設計されたハードウェアを使用して、数日以内に完了できます。各関節にはリアルな動きを維持するための制限があります。
ベースライン
私たちは、最新のヒューマノイド制御方法を用いてシミュレーションスポーツをテストします。各タスクは異なるアプローチを使用して訓練され、私たちのスポーツ環境全体でさまざまな方法のパフォーマンスを観察します。
メトリクス
成功は、ジャンプ、投げ、ゴールのような簡単に量的に評価できるタスクに基づいて測定します。各タスクは多数のトライアルに対して評価され、パフォーマンスの質に対する洞察を提供するメトリクスが収集されます。
人気のシミュレーションヒューマノイドアルゴリズムのベンチマーキング
さまざまな制御方法を評価し、異なるスポーツ間でどのように機能するかを比較します。結果を調べることで、ヒューマノイドにスポーツタスクを教えるためにどの方法がより効果的であるかを判断できます。
制限、結論、今後の研究
SMPLOlympicsは複数のスポーツ環境を提供していますが、いくつかの人気スポーツはシミュレーションの課題のために含まれていません。私たちの初期の報酬設計は、特に競技チームスポーツでより良い結果を生み出すために改善が可能です。
要するに、SMPLOlympicsはヒューマノイドがスポーツに参加できる包括的なシミュレーション環境のセットを紹介します。丁寧にデザインされ、人間の動きの強力な指導を取り入れることで、これらのヒューマノイドはさまざまなスポーツタスクで印象的なパフォーマンスを達成できます。このフレームワークは、将来的にヒューマノイドの行動をより高度に理解し、発展させるための基盤を築いています。
附録には、報酬やトレーニング方法の具体的なデザインを含む環境に関する追加詳細が提供されています。これらのスポーツ環境で達成された成果と初期設計に基づくトレーニング結果の包括的な定性的結果にアクセスできます。
タイトル: SMPLOlympics: Sports Environments for Physically Simulated Humanoids
概要: We present SMPLOlympics, a collection of physically simulated environments that allow humanoids to compete in a variety of Olympic sports. Sports simulation offers a rich and standardized testing ground for evaluating and improving the capabilities of learning algorithms due to the diversity and physically demanding nature of athletic activities. As humans have been competing in these sports for many years, there is also a plethora of existing knowledge on the preferred strategy to achieve better performance. To leverage these existing human demonstrations from videos and motion capture, we design our humanoid to be compatible with the widely-used SMPL and SMPL-X human models from the vision and graphics community. We provide a suite of individual sports environments, including golf, javelin throw, high jump, long jump, and hurdling, as well as competitive sports, including both 1v1 and 2v2 games such as table tennis, tennis, fencing, boxing, soccer, and basketball. Our analysis shows that combining strong motion priors with simple rewards can result in human-like behavior in various sports. By providing a unified sports benchmark and baseline implementation of state and reward designs, we hope that SMPLOlympics can help the control and animation communities achieve human-like and performant behaviors.
著者: Zhengyi Luo, Jiashun Wang, Kangni Liu, Haotian Zhang, Chen Tessler, Jingbo Wang, Ye Yuan, Jinkun Cao, Zihui Lin, Fengyi Wang, Jessica Hodgins, Kris Kitani
最終更新: 2024-06-28 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2407.00187
ソースPDF: https://arxiv.org/pdf/2407.00187
ライセンス: https://creativecommons.org/licenses/by-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。