空中データを使った樹種識別の進展
新しい技術が樹種のマッピングと森林管理を強化してるよ。
― 1 分で読む
森の木の種類を理解することは、これらの地域を管理したり、保全活動を計画したり、環境を研究したりする上で重要だよね。昔は、木の種類のデータを集めるのに主に二つの方法が使われてた。一つ目は特定の土地のプロットで木を数える方法で、良質なデータが得られるけど、範囲は狭い。二つ目は衛星画像を使って広いエリアでの木の種類の多様性を予測する方法だけど、これだと個々の木の情報はわからないんだ。
最近の空中技術の進歩が、この二つの方法のギャップを埋める手助けをしているよ。飛行機やドローンからの高解像度画像を使うことで、研究者は広大な風景における木についての詳細な情報を得られるようになった。この技術のおかげで、数十から数千ヘクタールのデータを集められるから、森林の構造や自然や人間の影響でどのように変わっていくかを理解するのに役立つんだ。
個々の木の検出
空から個々の木を検出することは環境研究での焦点になってる。特定のエリアにどれだけの木があるかを知ることは、いろんな研究や管理のタスクに役立つから重要なんだ。個々の木がどこにあるかを特定したり、木の冠(上の部分)を測定したりするのはこの研究の重要なステップだよ。これらのタスクのおかげで、空中画像から木を正確に検出できるアルゴリズムの開発が進んでる。
深層学習、つまり人工知能の一種がこのタスクには人気のアプローチになってる。ラベル付きの画像や地上データを使うことで、AIモデルは木の位置や種類を特定する方法を学ぶんだ。ただ、かなりの挑戦として、さまざまな環境の木の冠の形をキャッチするための十分なトレーニングデータを集める必要がある。
研究者が画像から木の冠を特定したら、次のステップはそれぞれの冠に正しい種類名をラベル付けすること。これを達成するために多くのモデルが提案されてるけど、異なる生態系でのパフォーマンスに関してはまだ不確かなんだ。モデルを改善するために、研究者はより良い結果を得るために複数年の空中画像を使うことを提案してる。
もう一つの問題はクラスの不均衡。多くの環境では、いくつかの木の種類が優勢で、モデルがあまり一般的ではない種類を学ぶのが難しくなる。これがAIモデルをトレーニングする上で大きな挑戦なんだ。
国家生態観測ネットワーク(NEON)の進展
国家生態観測ネットワーク(NEON)は、アメリカ全土でオープンアクセスの高解像度の空中データを提供することで地域の森林の理解を進めてるよ。NEONはさまざまな地点から標準化されたデータを集めていて、これは木の種類の詳細な地図を作るのに役立つんだ。
一つの大きな目標は、個々の木の冠を示す地図を作成して、森林、生態系、野生動物に関する研究を支援すること。通常の写真、高さモデル、スペクトルデータのような異なるタイプの空中データを利用することで、研究者たちは24のNEONサイトから81種の木の1億本以上の木の場所を予測してる。
この作業は以前のデータセットを基に、種類や健康状態の詳細を追加してるから、バイオダイバーシティや自然資源管理に焦点を当てた研究にもデータセットの有用性が広がるんだ。
データ収集方法
NEONは年に一度、木に葉がある時期に空中データを集める。データはピークの緑の時期に取得されて、一貫性を確保するようにしてるよ。NEONのいくつかのデータ商品には、高解像度カメラ画像、樹冠の高さモデル、ハイパースペクトル画像があって、これらは木の種類を光の反射方法に基づいて識別するのに役立つんだ。
地上データは、固定されたプロットからの木の測定値を含んでいて、空中データと連携するために必要な木の種類に関する情報を提供する。さまざまなソースからさらに多くの木のデータを集めて、できるだけ多くの種類がモデルに含まれるようにしてるんだ。
地上データからの木の種類情報を空中画像と効果的に結びつけるために、データの品質と正確性を確保するためのフィルタリングアプローチが使われる。地上の測定値と空中データを比較することによって、特定の基準を満たさない木を除外して、最も信頼性の高いデータだけをAIモデルのトレーニングに使えるようにしてるよ。
木の冠の予測
DeepForestアルゴリズムは木の冠を予測する上での重要なツールだよ。このモデルは時間と共に改善されてきて、今では公開されてて、平均的なリコール率は約72%を達成してる。これは、モデルが画像内のかなりの部分の木を正しく特定できることを意味してる。
でも、いくつかの制限も残ってる。冠の予測の正確性は木の間隔や種類の多様性に応じて変わることがある。一般的に、オープンな森林では間隔の開いた木の方が、密集した森林環境の木よりも良い結果が得られる。
木の冠が検出されたら、それぞれの冠が生きているか死んでいるかを、すべてのNEONサイトの画像を使ってトレーニングされた深層学習モデルで分類する。この分類は、木の健康状態を決定するのに役立つ、森林ダイナミクスを理解する上で重要な要素なんだ。
種類の特定
木の冠に種類名をラベル付けするために、研究者たちは各NEONサイトのためにユニークなモデルを開発したよ。これは、各モデルがそのサイトに存在する特定の木の種類に合わせて調整されていることを意味するんだ。このプロセスでは、木がさまざまな波長でどのように光を反射するかを測定するハイパースペクトルデータを利用して、木の種類を分類する。
階層的なモデルアプローチがクラスの不均衡を改善するために採用されている。このシステムでは、種類が類似点に基づいてサブモデルにグループ化されるから、モデルは一般的な種類と稀な種類の両方をより効果的に処理できるようになる。このアプローチは、密接に関連する種類の予測エラーを減らすことも目指してるんだ。
モデルが適用されると、利用可能な年ごとに予測が行われて、バイアスや過剰適合を最小限に抑えるようにしてる。最終的には、このプロセスによって複数のサイトにわたる予測された木の種類の包括的なデータセットが作成されるんだ。
種類予測の結果
種類の分類のために作成されたモデルは、NEONサイト全体でさまざまな木の種類を特定するのに成功したよ。平均して、各サイトには約6.56種が表示されていて、ハーバード森林では最大15種、他のいくつかのサイトでは3種が最小だった。全体として、これらの予測はサイトでの木の種類の豊かさの高い割合を捉えているんだ。
正確性の測定では、モデルがうまく機能していて、約78.8%のマイクロ精度と約75.8%のマクロ精度を達成してる。マイクロ精度はすべての予測の全体的なパフォーマンスを示し、マクロ精度は特にあまり一般的でない種類の正確さを強調してる。
予測からのデータは、特定の木の種類がサイト全体で重要な部分を占めていて、いくつかの種類がその豊富さに応じて予測を支配していることを示している。このダイナミクスを理解することは、異なる種類が生態系にどのように寄与するかを研究する上で重要だよ。
課題と制限
生成されたデータセットは広範だけど、考慮すべき課題と制限がある。予測の正確性は、高い木の多様性や密集した冠のある地域では低下することがあって、種類を区別するのが難しくなることがある。それに、小さな木、つまりサブキャノピーの木は、空中の予測には含まれていないから、データセットではあまり代表されてないんだ。
さらに、木を正確にラベル付けして分類することには不確実性が伴う。エラーは、木の種類の誤認識や冠の輪郭の不正確さなど、さまざまな要因から発生することがある。使用されたアルゴリズムはテストされており、かなりの信頼性があることが示されているけど、予測はまだあくまで推定に過ぎないんだ。
未来に向けて
データの質とモデルの正確性を改善するためには、継続的なデータ収集が不可欠だよ。研究者は、あまり代表されていない種類のデータを集めることに焦点を当てることができる。珍しい種類がある特定の地域からデータを集めるターゲットサンプリングが、モデルの知識基盤を強化するのに役立つんだ。
新しい研究者がNEONサイトに来ることで、森林生態に関するより豊かな理解が育まれるだろう。キャノピー木の予測と他の生態学的データを組み合わせれば、これらのシステム内の相互作用についてより深く洞察できるようになる。これは、予測をより詳細な環境データや歴史的記録に結びつけることを含むんだ。
最終的な目標は、種の予測をより広範な生態学的研究で信頼して使えるレベルまで進めることなんだ。モデルを改善して森林生態系をよりよく理解することで、研究者は保全活動や生態管理に役立てたいと思ってるんだ。
タイトル: Individual tree crown maps for the National Ecological Observatory Network
概要: The ecology of forest ecosystems depends on the composition of trees. Capturing fine-grained information on individual trees at broad scales provides a unique perspective on forest ecosystems, forest restoration and responses to disturbance. Individual tree data at wide extents promises to increase the scale of forest analysis, biogeographic research, and ecosystem monitoring without losing details on individual species composition and abundance. Computer vision using deep neural networks can convert raw sensor data into predictions of individual canopy tree species through labeled data collected by field researchers. Using over 40,000 individual tree stems as training data, we create landscape-level species predictions for over 100 million individual trees across 24 sites in the National Ecological Observatory Network. Using hierarchical multi-temporal models fine-tuned for each geographic area, we produce open-source data available as 1 km2 shapefiles with individual tree species prediction, as well as crown location, crown area and height of 81 canopy tree species. Site-specific models had an average performance of 79% accuracy covering an average of six species per site, ranging from 3 to 15 species per site. All predictions are openly archived and have been uploaded to Google Earth Engine to benefit the ecology community and overlay with other remote sensing assets. We outline the potential utility and limitations of these data in ecology and computer vision research, as well as strategies for improving predictions using targeted data sampling.
著者: Ben Weinstein, S. Marconi, A. Zare, S. Bohlman, A. Singh, S. J. Graves, L. Magee, D. J. Johnson, S. Record, V. E. Rubio, N. G. Swenson, T. Veblen, P. Townsend, R. A. Andrus, E. P. White
最終更新: 2024-05-17 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2023.10.25.563626
ソースPDF: https://www.biorxiv.org/content/10.1101/2023.10.25.563626.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。