Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# コンピュータビジョンとパターン認識

スタイライズされたキャラクターのための革新的なポーズ転送

新しい方法で、複雑なセットアップなしにユニークなスタイルのキャラクターのアニメーションが簡単になるよ。

― 1 分で読む


スタイライズされたキャラクスタイライズされたキャラクターのポーズ転送のアニメーションを簡素化する。革命的な方法が多様なキャラクターデザイン
目次

アニメーション、映画、ゲームの世界では、スタイライズされたキャラクターにリアルな動きをつけるのは難しい課題だよね。キャラクターはアーティストによってデザインされていて、独特な形やサイズ、特徴を持ってるから、ポーズを他のキャラクターに移すのが結構難しいんだよ。それぞれのキャラクターには独自の動き方があるからね。伝統的な方法では、キャラクターの動きを導くために「リグ」、つまり骨組みを作る必要があるけど、これがめちゃくちゃ面倒で時間がかかる。

課題

既存の動きの転送方法の多くは、キャラクターがすでに骨格を持っていることを前提にしているんだ。だから、リグがないキャラクターをアニメートするのは難しい。一方で、いくつかの方法は訓練中にキャラクターが望ましいポーズをとっていることを要求するから、それも難しいことがある。

ここでの目標は、構造に追加作業を必要とせずに、あるキャラクター(通常は一般的なモデル)のポーズをスタイライズされたキャラクターに効率的に転送することだよ。

提案された解決策

このアプローチの焦点は、アニメートされるキャラクターにリグを必要とせずにポーズを転送できる方法を開発すること。これを「ゼロショット」ポーズ転送と呼ぶんだ。つまり、未見のキャラクターに直接作用することを目指しているんだ。

新しいモデルでは、標準的なヒューマノイドや動物のフィギュアからスタイライズされたキャラクターにポーズを転送できるよ。元のキャラクターのニュートラルな形と欲しいポーズがわかれば、アーティストはもはや手動でキャラクターをリグしたり、複雑なセットアップを心配する必要がないんだ。

モデルの主要な要素

  1. 形状理解: この部分は、キャラクターの形状を細かく理解するのに役立つ。キャラクターの特徴を表すコードを作成するんだ。このコードは、ポーズ転送プロセスで自然に見える動きを保証するために使われる。

  2. ポーズ変形: 形状が理解されると、ポーズ変形部分が引き継ぐ。先に作成した形状コードを使って、キャラクターの形を望ましいポーズに合わせて調整するんだ。これは、キャラクターの表面上のポイントの配置を変えることで行われる。

  3. テスト時トレーニング: この革新的な側面は、モデルが実際の使用時に自己改善できるようにするんだ。モデルが新しく見たことのないキャラクターに出会うと、すぐに学習して改善するんだよ。

方法の利点

この方法にはいくつかの利点があるよ:

  1. 使いやすさ: スタイライズされたキャラクターのリグ版を必要としないから、アニメーターはもっと早く、自由に作業できる。

  2. 柔軟性: モデルはさまざまなキャラクターの形やサイズに適応できる。この柔軟性のおかげで、ヒューマノイドから犬や猫のような四足のクリーチャーまで対応できる。

  3. 出力の質: 結果として得られるアニメーションは高品質を保つ。キャラクターは滑らかに、自然に動き、リアルな動きに似ていて、昔の方法でよく見られたぎこちないグリッチがない。

  4. 通常モデルでのトレーニング: トレーニングプロセスでは、スタイライズされたキャラクターではなく、通常のキャラクターを使うから、モデルの堅牢性が増すんだ。

実際の応用

この新しい方法は、いくつかの分野で使えるよ:

  • ゲーム開発: ゲームデザイナーは、以前のセットアップの悩みなしにキャラクターをすぐにアニメートできる。
  • 映画アニメーション: アニメーターは、映像のスタイライズされたキャラクターに対して迅速な結果を出せて、製作スケジュールを守れる。
  • バーチャルリアリティ: 期待通りに動くリアルなアバターを作成できて、多様な状況にも対応できる。

既存の方法

私たちの方法について説明する前に、ポーズ転送の伝統的かつ現在の実践をざっと見てみよう:

1. リギングとスキニング

ほとんどのアニメーションは、キャラクターのための骨組みを作って、構造的な動きを可能にするリギングというプロセスを使用するんだ。でも、これは独特なスタイライズキャラクターに対処する際には労力がかかる。

2. 対応メッシュを使ったポーズ転送

いくつかの方法は、すでにお互いにマッチしている2つのキャラクターを必要とする。一つがリファレンスで、もう一つは動き方があらかじめ定義されていなきゃならないから、アニメーターはポーズを転送する前に両方のキャラクターを合わせる必要があるから、創造性が制限される。

3. 学習ベースのアプローチ

最近の技術は、ポーズ転送をサポートするためにニューラルネットワークを利用し始めたけど、訓練データと大きく異なるキャラクターに対しては苦労することが多い。これが、スタイライズされたキャラクターに対して効果を発揮するのを制限してしまう。

私たちのモデルの仕組み

私たちの方法の核心は、キャラクターの形状を理解しつつ、必要に応じて変形することに依存している。以下のように進むよ:

形状表現

最初に、モデルはキャラクターの形を分析する。キャラクターの特徴を描写する内部コードを作成するんだ。このコードは、ポーズが必要なときにキャラクターがどのように動くべきかを導く設計図の役割を果たす。

目標ポーズマッピング

次に、望ましいポーズをマッピングする。ポーズを単に直接転送するのではなく、モデルは目標ポーズの細かい部分を学ぶんだ。これにより、ただ位置を再現するのではなく、スタイライズされたキャラクターの独特な特徴に応じて調整することができる。

表面ポイント調整

モデルは身体の部分全体を調整するのではなく、キャラクターの表面上の個々のポイントを調整する。これにより、キャラクターがリアルに動くための正確な調整が可能になる。

使用中の継続的学習

モデルが新しいキャラクターを見ることで、自らの理解を深める。テスト時トレーニングを適用することで、モデルは特に珍しいポーズが提示されたときに調整し、正確さを維持できるようになる。これにより、未見のキャラクターに対してもモデルがすぐに適応できるんだ。

実験と結果

私たちの解決策の効果をテストするために、さまざまなキャラクターカテゴリーでいくつかの実験を行ったよ。

1. 二足歩行キャラクター

スタイライズされた人間のフィギュアを使った結果、モデルは従来の方法と比べて滑らかでリアルな動きを維持できた。アニメーションは流動的で、平均的な動きのエラーは大幅に減少して、新しいアプローチの効果が強調された。

2. 四足歩行キャラクター

スタイライズされた犬や猫のような動物に対しても同様のテストを行った。こちらでも、私たちの方法は以前の努力を上回り、正確なポーズ転送を示し、キャラクターの独特な特徴を維持できた。

3. アクセサリーを持つスタイライズキャラクター

帽子や翼などのアクセサリーを持つキャラクターも、自然な動きを維持する驚くべき能力を示して、モデルの柔軟性や適応性を証明した。

モデルの限界

モデルはさまざまなテストで好成績を収めたけど、いくつかの限界も確認されたよ:

  1. 複雑なアクセサリー: 複雑な構成要素を持つキャラクターは、動きの正確性においてまだ課題が残るかもしれない。

  2. 手の動き: モデルは手を剛体のように扱うから、複雑なアニメーション中の正確な動作が難しいかもしれない。

  3. トレーニングデータの多様性: モデルは多様なトレーニングセットに大きく依存しているから、特定のキャラクタータイプが過小評価されると、モデルのパフォーマンスが落ちる可能性がある。

今後の方向性

今後、開発のためのいくつかの可能な道があるよ:

  1. 手の動きの向上: 今後のバージョンでは、手や細かい指の動きをより良くアニメートすることに焦点を当てることができる。

  2. キャラクタータイプの拡大: より広範なキャラクタータイプでモデルをトレーニングすることで、一般化や適応能力を向上させられるかもしれない。

  3. リアルタイム編集の組み込み: アニメーターがリアルタイムでポーズを操作できるツールを開発すれば、クリエイティブなプロセスが向上するかもしれない。

結論

スタイライズされたキャラクターにポーズを転送する新しい方法は、アニメーション分野において大きな進歩を示している。プロセスを簡素化し、より大きな柔軟性を持たせることで、アニメーターはさまざまなキャラクタータイプに対してリアルな動きを簡単に実現できる。この方法は時間を節約するだけでなく、新しいクリエイティブな可能性を開き、アニメーション、ゲーム、映画における豊かなストーリーテリングを可能にする。未来は、この方法が新しい課題に適応し進化していく中で明るい展望を持っている。

オリジナルソース

タイトル: Zero-shot Pose Transfer for Unrigged Stylized 3D Characters

概要: Transferring the pose of a reference avatar to stylized 3D characters of various shapes is a fundamental task in computer graphics. Existing methods either require the stylized characters to be rigged, or they use the stylized character in the desired pose as ground truth at training. We present a zero-shot approach that requires only the widely available deformed non-stylized avatars in training, and deforms stylized characters of significantly different shapes at inference. Classical methods achieve strong generalization by deforming the mesh at the triangle level, but this requires labelled correspondences. We leverage the power of local deformation, but without requiring explicit correspondence labels. We introduce a semi-supervised shape-understanding module to bypass the need for explicit correspondences at test time, and an implicit pose deformation module that deforms individual surface points to match the target pose. Furthermore, to encourage realistic and accurate deformation of stylized characters, we introduce an efficient volume-based test-time training procedure. Because it does not need rigging, nor the deformed stylized character at training time, our model generalizes to categories with scarce annotation, such as stylized quadrupeds. Extensive experiments demonstrate the effectiveness of the proposed method compared to the state-of-the-art approaches trained with comparable or more supervision. Our project page is available at https://jiashunwang.github.io/ZPT

著者: Jiashun Wang, Xueting Li, Sifei Liu, Shalini De Mello, Orazio Gallo, Xiaolong Wang, Jan Kautz

最終更新: 2023-05-31 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2306.00200

ソースPDF: https://arxiv.org/pdf/2306.00200

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事