Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# コンピュータビジョンとパターン認識# グラフィックス

LoD-NeuSを使った3D表面再構築の進展

新しい手法は、LoD-NeuSを通じて3Dモデリングの詳細と品質を向上させる。

― 1 分で読む


LoD-NeuS:LoD-NeuS:3Dモデリングの未来げてる。新しい方法が表面再構築技術の限界を押し広
目次

最近の3Dモデリングの進展で、ニューラルレンダリングという方法を使って詳細でリアルな画像を作る新しい方法が出てきた。このアプローチでは、コンピュータが異なる視点から画像を理解して生成できるようになるんだけど、特に物体の表面の微細なディテールを正確に捉えることにはまだ課題が残っている。従来の方法は、複雑な形状を描くのにしばしば苦労してる。

その課題を改善するために、ニューラルインプリシットサーフェス(NeuS)という新しい方法が登場した。従来の手法が表面を記述するために柔らかい密度に焦点を当てるのに対し、NeuSは符号化された距離関数(SDF)を利用。この方法は、表面を描写するのにより明確な方法を提供する。NeuSは有望な結果を示しているけど、詳細な幾何情報を捉えるのは依然として難しい。

表面を再構築する主な問題は、小さなディテールを正確に再現する能力だ。以前のモデルは頻度位置エンコーディングという手法を使ってこれに対処しようとしたが、しばしばうまくいかない。このモデルはスムーズだけど詳細が少ない表現になりがちで、特に複雑な形状では顕著。

HF-NeuSという別のアプローチは、高周波の細部を学ぶことを目的とした変位ネットワークを導入したけど、情報を処理する方法に制限があるため、生成する新しいビューで多くのディテールが失われたり、誤って表現されたりすることがある。

従来の明示的なボクセルベースの方法は、マルチスケールのプリフィルタリング技術を用いて同様の問題に対処して、洗練された見た目を達成し、視覚的アーティファクトを減少させてきた。その後、最近のNeuSベースの技術は、結果をさらに向上させるために暗黙的および明示的な方法を組み合わせ始めている。ボクセルグリッドのような表現技術を活用することで、これらの方法はより良い幾何学的近似を目指している。しかし、この二つのアプローチを組み合わせることには独自の障害がある。

提案手法

高品質な幾何をマルチビュー画像を使って再構築する課題に対処するために、LoD-NeuSという新しい手法を提案する。この方法は、異なる詳細レベル(LoD)のための符号化手法と暗黙的な表面表現をシームレスに統合するフレームワークを導入する。目標は、画像の複雑な幾何学的特徴を忠実に再構築すること。

暗黙的な表面は、トライプレーンアーキテクチャを使ったマルチスケールフィーチャーボリュームで表現される。このボリュームは、幾何の詳細の効果的なサンプリングを可能にする技術を使って最適化される。トライプレーン位置エンコーディング戦略を採用することで、新しい方法は画像の異なる部分で様々な詳細レベルを捉える能力を高めようとする。

さらに、高周波な幾何表現から生じるエイリアシング効果を軽減するために、モデルは円錐形の中でマルチコンボリューションされたフィーチュア化技術を組み込んでいる。これにより、3D幾何の細かいディテールを正確に回復できる。また、この戦略は、SDFの成長改善戦略を通じて薄い表面を再構築する際の前の手法の課題を改善するものだ。

試験では、LoD-NeuSは高品質な表面を再構築し、新しいビューを生成する点で既存のNeuSベースのアプローチを上回った。特に、詳細なオブジェクトやシーンに関するシナリオでその効果が顕著だった。

バックグラウンド

マルチビュー3D再構築

複数の写真から3D表面を再構築するタスクは、コンピュータビジョンとグラフィックスの分野において基礎的なものだ。このプロセスは、ポイントベースの再構築、表面再構築、ボリュメトリック再構築の3つの主なカテゴリーに分けることができる。

ポイントベースの手法は、まず複数の画像を通じて一致するポイントを特定して各ピクセルの幾何学を評価し、その情報をメッシュ表面プロセスに組み込む。その後、表面再構築手法は深度マップから直接表面を作成することに焦点を当て、ボリュメトリック手法はマルチビューから得られたボクセルグリッド内の色と占有を推定する。

表面再構築の精度は、対応するポイントを効果的にマッチングすることに大きく依存していて、微妙なテクスチャがある領域では複雑になりがち。こうした問題を回避するために、ボリュメトリック技術はシーンを複数のサンプルに分解するが、高いメモリ要求があり、解像度を制限したり全体の品質を損なうことがある。

ニューラルインプリシットサーフェス

暗黙的なニューラル表現の登場により、高度に詳細な表面の再構築に希望が見出されている。この分野の注目すべき競争者は、Neural Radiance Fields(NeRF)で、シーンの放射を学習し、ボリュメトリックレイトレーシングを通じて新しいビューを生成する。NeRFは、新しいビュー合成や逆レンダリングなど、数多くのタスクに適用されている。

ただ、密度関数を使って滑らかな表面を得ることは、しばしばノイズの多い不正確な幾何を生むことがある。それに対して、符号化された距離関数を使用することで、より明確なアプローチが提供され、いくつかの落とし穴を避けるのに役立つ。NeuSは、フレームワーク内でSDFを統合することでNeRFの能力を拡張するために登場した。

とはいえ、NeuSやその後継者たちは、高周波の詳細を正確に捉える課題に直面している。頻度位置エンコーディングを使用することで役立つが、さまざまな領域全体で異なる詳細レベルを維持するにはしばしば不十分だ。さらに、サンプリング技術は、視覚的アーティファクトを引き起こす情報の不足を招くことがある。

アンチエイリアシング表現

ポリゴンメッシュやボクセルグリッドといった従来の表現方法は、視覚的アーティファクトを生じることなく効率的に表面を再構築できる。これらは、異なる詳細レベルを管理しつつ効率性を維持するマルチスケールプリフィルタリング技術を使用する。

それに対して、連続的な暗黙的表面表現は、エイリアシングを防ぐためにスーパサンプリングのような高度な技術を必要とし、処理が遅くなることがある。明示的な表現と暗黙的な表現を組み合わせたハイブリッドアプローチが、両方の技術の利点を捉える解決策として浮上している。しかし、明示的な方法のアンチエイリアシングの利点をハイブリッド表現と融合させる場合には課題が残る。

マルチスケールトライプレーンエンコーディング

最近の進展で、マルチスケールグリッドからの学習可能な特徴を利用することで、再構築品質と速度の両方を向上させることができることが示されている。トライプレーンアーキテクチャは、複雑な幾何を効率的に管理する柔軟な手段を提供する。

高周波の詳細を再現する際の困難を克服するために、私たちはフレームワーク内にマルチスケールトライプレーン表現を実装。トライプレーン構造は、3つの直交する機能平面で構成され、中心に3Dキューブとして機能する。各3Dポイントを平面に投影して特徴を収集し、バイリニア補間を通じてそれらを融合。

私たちのメソッドでは、これらの特徴は異なる解像度のレベルから来ていて、連続的な方法で様々な詳細レベルを捉えながら明示的なディテールを保持する。

暗黙的表面のアンチエイリアシングレンダリング

マルチスケールトライプレーン特徴が収集されたら、次のステップはボリュームレンダリングのためにレイに沿ったサンプルのSDFを推定すること。従来の技術は、ピクセルを通してレイを投影するけど、サイズや形状を考慮せず、高周波の情報を見落としてエイリアシングアーティファクトを引き起こす可能性がある。

これに取り組むために、レイを円錐として扱うことによってレンダリングプロセスを再定義する。このアプローチは連続的な詳細レベルを可能にし、再構築中に細かいディテールをより正確に捉えるのに役立つ。

単に各ピクセルを通過するレイのサンプリング数を増やすのではなく、それがコストを上げることになるので、私たちはより効率的な解決策を開発。円錐形のレイを考慮することで、これらの円錐形の中で特徴を統合できるので、オーバーサンプリングせずに必要な情報を集めることができる。

トレーニングと最適化

LoD特徴が確立されたら、次のステップはサンプルの色と符号化された距離を予測すること。ニューラルネットワーク内の一連の層がこのデータを処理する。モデルの学習可能なパラメータは、効率的な学習を確保するためにトレーニングプロセス中に損失関数を使用して最適化される。

モデルの性能を評価するために、ピーク信号対雑音比(PSNR)やチャンファー距離など、さまざまな指標が使われる。これらの指標は、再構築されたメッシュの精度と生成されたビューの質を測るのに役立つ。

結果と比較

私たちは、NeuSやHF-NeuSなどの他の先進的な技術と比べて私たちの方法を評価する実験を行った。さまざまなテストシナリオを通じて、私たちのアプローチは多数の指標で優れたパフォーマンスを示した。詳細なディテールや滑らかな表面を再構築するだけでなく、トレーニングと推論時間の両方で他の方法と比べて高い効率も示した。

定性的な評価においても、私たちのモデルは特に細かいディテールが重要な複雑なオブジェクトで視覚的に魅力的な結果を一貫して生み出している。

結論

LoD-NeuSの導入は、3D表面再構築の課題に対する有望な解決策を提供する。暗黙的表現とマルチスケールトライプレーンエンコーディングを効率的に統合することで、私たちの方法は複雑なシナリオでも高品質な幾何学的ディテールを達成することができる。

ニューラルレンダリングが進むにつれて、詳細な表面を正確に捉え生成する方法の必要性はますます高まるだろう。私たちのアプローチは、既存の技術を改善するだけでなく、このエキサイティングな分野での未来の発展への道を開くことにもなる。

私たちの貢献は、マルチビュー画像からリアルな3D再構築を目指す重要な一歩を反映しており、細かいディテールが正確に表現され、視覚的アーティファクトが最小限に抑えられることを確保している。この技術のさらなる探求と洗練が続けば、バーチャルな体験におけるリアリズムの向上につながるかもしれない。

オリジナルソース

タイトル: Anti-Aliased Neural Implicit Surfaces with Encoding Level of Detail

概要: We present LoD-NeuS, an efficient neural representation for high-frequency geometry detail recovery and anti-aliased novel view rendering. Drawing inspiration from voxel-based representations with the level of detail (LoD), we introduce a multi-scale tri-plane-based scene representation that is capable of capturing the LoD of the signed distance function (SDF) and the space radiance. Our representation aggregates space features from a multi-convolved featurization within a conical frustum along a ray and optimizes the LoD feature volume through differentiable rendering. Additionally, we propose an error-guided sampling strategy to guide the growth of the SDF during the optimization. Both qualitative and quantitative evaluations demonstrate that our method achieves superior surface reconstruction and photorealistic view synthesis compared to state-of-the-art approaches.

著者: Yiyu Zhuang, Qi Zhang, Ying Feng, Hao Zhu, Yao Yao, Xiaoyu Li, Yan-Pei Cao, Ying Shan, Xun Cao

最終更新: 2023-09-19 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2309.10336

ソースPDF: https://arxiv.org/pdf/2309.10336

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事