Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生態学

リモートセンシングを使ったアメリカの湖の水質追跡

衛星データを使ってアメリカ本土の湖の健康を監視する研究。

― 1 分で読む


湖の健康のためのリモートセ湖の健康のためのリモートセンシング察をもたらしてるよ。衛星データがアメリカの湖の水質に新たな洞
目次

湖の水質を評価するのは重要だけど、大きなエリアだと難しいんだよね。水のサンプルを集めるのに時間がかかって、実際の状況をざっくりしか把握できないことが多い。特にグローバルサウスや遠隔地では、湖のモニタリングの歴史がない地域も多いし。気候変動の影響が大きくなる中で、世界中の湖の水質を追跡するためのより良い方法が必要なんだ。

リモートセンシング技術は研究者にとって人気のツールになってる。これを使うと、科学者は衛星からデータを取得して、時間の経過とともに分析できる。これにより、現地のサンプリングの限界を埋める手助けができる。多くの科学者が、衛星データを水質研究に活用する方法を改善するために取り組んできたんだ。衛星データと現地のサンプルを組み合わせることで、湖の状態を何年にもわたって理解することができるんだ。

研究アプローチ

この研究では、1984年から2020年までのアメリカ本土の湖の水質を調べました。高度なリモートセンシング技術を使って、衛星データから6つの主要な水質変数を予測することを目指しました。最終的なデータセットは、約137,000の湖をカバーしていて、6つの水質測定について少なくとも1つの推定値を提供しています。この取り組みは、湖の健康を時間の経過とともに理解するための先行研究や技術の発展に基づいています。

私たちが注目した6つの水質変数は:

  • クロロフィルa(CHL):水中の藻の量を測る指標で、生産性を示す。
  • セッキ深度:水の透明度を測る指標。
  • 真の色:水の色を示し、有機物の反映がある。
  • 溶存有機炭素(DOC):水中の有機物の一種。
  • 総懸濁物質(TSS):水中の土や有機物のような粒子。
  • 濁度:水中の光の散乱に基づいて水の透明度を測る。

これらの変数を調べることで、水質や湖全体の健康状態がより明確にわかるんだ。

リモートセンシングデータ

私たちは、長い歴史と広範囲なリーチ、良質な画像のためにLandsat衛星プログラムのデータを使用しました。Landsatは1980年代半ばから画像をキャプチャし始めていて、研究者にとって豊富な情報を提供しています。私たちの研究では、1984年から2020年までのLandsat 5、7、8のデータを使用しました。

プロセスでは、反射値-つまり水から反射される光-を抽出し、6つの水質変数に関連するさまざまな測定値と一緒に扱いました。このデータはその後、分析のためにクリーンアップされ、準備されました。また、リモートセンシングデータと現地の水質測定を組み合わせたデータベースも作成しました。

Google Earth Engineプラットフォームを使用して、4500万枚以上の画像を分析し、私たちのデータセットを作成しました。このプラットフォームは強力なデータ処理を可能にし、大量の衛星データを扱いやすくします。

マッチアップトレーニングデータセット

信頼性のあるトレーニングデータセットを作成するために、衛星データと既存の現地水質データを統合しました。この組み合わせにより、6つの水質変数に対するより正確な予測モデルを開発できました。トレーニングデータセットには、異なる日付の湖データと対応する衛星画像の組み合わせである700,000を超えるマッチアップが含まれています。

クロロフィルデータについては、データセットをクリーンアップして非現実的な値を取り除くことに重点を置きました。私たちは、同じ日に複数の測定があった湖の中央値を取ることで精度を確保しました。この慎重なデータ処理は、予測ができるだけ正確であることを助けます。

テストワークフロ―コンポーネント

モデルに取り組む中で、ワークフローのさまざまなコンポーネントをテストする必要がありました。これには、画像の処理方法、使用したモデルの種類、マッチアップウィンドウの定義方法が含まれます。

テストを通じて、機械学習モデル、特にランダムフォレスト回帰モデルを使用すると、最良の結果が得られることがわかりました。これにより、水質変数の予測における機械学習の効果が確認されました。また、ピクセルレベルでのバンド比を計算することが、湖全体で計算するよりも効果的なアプローチであることがわかりました。

さらに、特定の低品質な画像を保持しても、予測には大きな影響がないことがわかりました。しかし、他の変数については、負の反射値を持つシーンは削除するのがベストです。この微妙なアプローチが、湖の状態をより正確に把握するのに役立ちます。

別々の予測モデルの構築

ワークフローを確立し、そのコンポーネントをテストしたら、6つの水質変数それぞれのために別々のモデルを構築しました。全ての変数にランダムフォレスト回帰モデルを使用し、選択したワークフローの強みを活かしました。

セッキ深度変数の説明された分散は63.7%で最も高かったです。これは、セッキ深度に関するモデルが現地測定と強い相関関係にあったことを意味します。他の変数は成功度が異なりましたが、すべてが水質のより広範な研究に対する期待を示しました。

各変数の主要な予測因子はほぼ一貫していました。衛星データからの異なるバンドの比率がモデルにおいて重要な役割を果たすことがわかりました。これは、特定の波長の光が特定の水質の側面を示すのにより適している可能性があることを示しています。

データ品質管理

私たちのデータセットの重要な部分は、私たちが設けた品質管理の手段です。データ内の潜在的な問題をフラグ付けし、ユーザーがニーズに応じてデータセットをフィルタリングできるようにしました。

どのデータポイントが高品質であるかを判断する基準を設定しました。たとえば、負の反射値を持つピクセルをフラグ付けし、取得したピクセルの割合を追跡しました。これらの品質管理手段は、ユーザーが分析に使用するデータを信頼できるようにします。

結果と発見

データを処理・分析した結果、私たちが調べた137,000の湖の水質についていくつかの重要な発見をしました。

まず、データセットにおける空間分布が顕著でした。予測の密度はアメリカ本土全体にうまく分布していましたが、サンプルデータの濃度が他の地域より高い場所もありました。

次に、予測モデルの成功度はさまざまでした。たとえば、総懸濁物質の予測値には最も大きなバイアスがあり、特定のシナリオでこの変数を正確にキャプチャすることに制限があることを示しています。

それでも、6つの水質変数にわたる全体的な予測は期待できるものでした。私たちのモデルの成功は、湖の健康を理解するために衛星データが持つ可能性を示すだけでなく、継続的なモニタリングの必要性も強調しています。

将来の研究への影響

私たちのデータセットは、アメリカ全体の水質追跡において重要な進展を示しています。この研究は、将来の研究者が湖の健康の傾向を時間の経過とともに調べるための扉を開きます。

リモートセンシングの能力が進化することで、研究者はより多くの変数や広いエリアを含む研究を拡大できるでしょう。このデータセットは、環境の変化や湖への圧力を理解するためにリモートセンシングがどれほど効果的であるかを示しています。

研究者はまた、特定の湖に私たちの発見を適用することができ、管理や保全努力に特に役立つことがあります。特定の湖で水質がどのように変化したかを理解することで、関係者はこれらの重要な資源を守るためのより良い戦略を立てることができます。

結論

水質を研究するためのリモートセンシングの利用は、データのギャップを効率的に埋めることができる強力なツールです。この研究は、湖の健康を監視する際の衛星データの可能性を強調し、将来の研究のための包括的なデータセットを提供します。

私たちが直面している環境の変化に対して、正確でアクセス可能な水質データを持つことは、ますます重要になっています。この研究は科学コミュニティに貢献するだけでなく、私たちの湖を守るために努力する政策立案者や保全活動家にとってもリソースとなります。

オリジナルソース

タイトル: LAGOS-US LANDSAT: Remotely sensed water quality estimates for U.S. lakes over 4 ha from 1984 to 2020

概要: Broad-scale, long-term studies of water quality (WQ) are critical to understanding global-scale pressures on inland waters, yet they are rare. This data product, LAGOS-US LANDSAT, addresses this gap by providing remote sensing-derived WQ estimates from machine learning models trained on in situ data of six essential WQ variables for 136,977 lakes in the continental US from 1984-2020. The dataset includes: (a) 45,867,023 sets of whole-lake water reflectances for six individual bands and 15 band ratios; (b) 740,627 matchups with in situ data for lake WQ data for chlorophyll, Secchi depth, true color, dissolved organic carbon, total suspended solids, and turbidity; and, (c) predictions from each reflectance set for all six WQ variables across the 37 yr period. Variance explained for the predictions ranged from 20.7% for TSS to 63.7% for Secchi. Data extraction from individual scenes was quality-controlled based on cloud-cover and pixel quality, and we tested and validated key parts of the workflow to inform future water quality studies using the Landsat platform.

著者: Patrick J Hanly, K. E. Webster, P. A. Soranno

最終更新: 2024-05-14 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.05.10.593626

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.05.10.593626.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事