Simple Science

最先端の科学をわかりやすく解説

# 生物学# 古生物学

新しいツールが化石分析を変えて生物多様性を向上させる!

DeepDiveRは、高度な技術を使って化石データから生物多様性の推定を簡素化するよ。

― 1 分で読む


化石分析が簡単に化石分析が簡単に物多様性を推定する方法を変える。DeepDiveRは、科学者が化石から生
目次

何年も前から、科学者たちは地球にどれだけの種が生息していたか、生命がどのように時間とともに変化してきたか、そして生物多様性に影響を与える要因について議論してきた。生物多様性がどう変わってきたかを理解することは大事で、特に気候変動が地球に影響を与えている今、現在や未来の変化についてもっと知る手助けになる。化石記録は、地球の環境の大きな変化に対して生命がどのように反応したかを示す唯一の明確な証拠だ。

でも、化石データを使って生物多様性を推定するのは難しい。実際に存在した種のうち、化石として保存されているのは1%未満だと言われている。今日の多くの動物グループは、あまり証拠を残していないかもしれない。本当に地球上の生命がどう進化したかを理解するためには、化石記録のギャップを埋める必要がある。最近の研究で、これらのギャップを考慮する一般的な方法が、特に広い地域を調べる際にうまく機能しないことがわかってきた。さまざまな要因が化石記録に与える影響が理解されつつあり、過去の生命形態をより良く推定するための新しい方法やデータベースが登場している。

化石を分析する新しい方法

DeepDiveという新しいアプローチは、先進的なコンピュータ技術を使って化石から生物多様性を推定する。この方法は、時間、場所、調べる生物のタイプなど、さまざまな要因を考慮するためにモデルとコンピュータ技術を組み合わせている。人気のプログラミング言語であるPythonを使って動作する。

DeepDiveのいくつかの利点がある。すべての利用可能なデータを使えるし、あまり代表的でない種でも考慮される。化石記録におけるバイアスも考慮して、非常に広い地域でも推定を行うことができる。これは、生物多様性についてより正確な理解を可能にする一歩だ。

ただし、DeepDiveがPythonに依存しているため、異なるプログラミング環境を好む科学者には使いにくいかもしれない。この問題に対処するために、DeepDiveRという新しいパッケージが導入され、Rという別のプログラミング言語で動作する。このパッケージは、科学者がPythonのコードを書くことなくRを使ってデータを準備できるようにしてくれる。

DeepDiveRの使い方

DeepDiveRは、研究者がデータを準備して分析を設定する手助けをしてくれる。分析プロセスは通常、3つの主要なステップを含む:1) トレーニングデータセットの作成、2) 深層学習モデルのトレーニング、3) 時間をかけた生物多様性についての予測。プログラムは、生物多様性や地理的歴史のシミュレーションを生成し、化石記録がどのように見えるかを模倣する。これらのシミュレーションは、欠けている化石データに基づいて元の多様性を再構築する方法を学ぶ特別なコンピュータモデルをトレーニングするために使われる。

この分析の出力には、トレーニングされたコンピュータモデル、シミュレーション、また時間とともに多様性がどう変化したかの視覚的な表現が含まれる。この視覚データは、研究者が発見をより良く解釈するのに役立ち、分析がどのように行われたかの記録を未来の参考のために保持する。

DeepDiveRの始め方

DeepDiveRを使い始めるには、研究者が自分のコンピュータにRをインストールする必要がある。GitHubリポジトリからソフトウェアを見つけることができる。必要な入力ファイルと設定ファイルを作成したら、DeepDiveをインストールして簡単なコマンドで分析を始めることができる。セットアップには、化石の発見データを含むファイルと、分析に必要なすべての設定が含まれているファイルが必要。

入力データは、種ごとにどのように発見されたかを詳細に示す必要がある。研究者は、このデータがクリーンで正確であることを確認しないと、データベースには未解決の問題や欠けた情報が含まれていることがある。

DeepDiveRが生成する設定ファイルには、分析のためのさまざまな設定が含まれている。ファイルパス、データ仕様、分析全体で使う時間枠に関する情報が記載されていて、このファイルは必要に応じて調整できるので、科学者は自分の作業を保存して後で見返すことができる。

分析の改善

DeepDiveRには、分析をより効率的にするための機能が含まれている。例えば、研究者は一つのコンピュータプロセッサだけでなく、複数のプロセッサを使ってシミュレーションをより迅速に実行できる。強力なグラフィックスプロセッシングユニット(GPU)を利用してモデルのトレーニングプロセスをスピードアップすることもできる。

DeepDiveRは、実際のデータをよりよく表現するためにシミュレーションのパラメータを自動で調整することも可能。これは重要な改善点で、モデルが解析されるデータセットに正確に調整されることを確保し、エラーの可能性を減らすのに役立つ。

さらに、DeepDiveRは現代の多様性を考慮するようにデザインされていて、予測を行う際にグループ内の生存種の数を考慮することができる。この点は、現在のデータを使って歴史的な分析を改善することで、生物多様性の推定の正確性を高めるのに役立つ。

例としての分析:新生代の肉食動物を調べる

DeepDiveRがどのように機能するかを示すために、新生代の哺乳類肉食動物の記録を分析した。この分析では、何千もの化石発見と、その時期に生息していたさまざまな種が関与していた。DeepDiveRを使用して、研究者たちはデータをシミュレートし、クレードがどう起こり、メンバーが時間とともにどのように異なる地域に広がったのかを反映させた。

この分析を通じて、肉食動物は進化の初期段階で多様性が着実に増加していったことがわかった。しかし、後期エオシーン期において、気候変動の影響で種の数が大幅に減少した。この減少の後、多様性は再び増加し、最終的には停滞し、その後、現代人が環境により多くの影響を及ぼし始めた後に再び減少していった。

この分析の結果、肉食動物の多様性の推定は以前の研究と一致していたが、多くの種がおそらく以前の研究で見逃されていたことも示唆された。このギャップは、徹底的な分析とデータ収集の改善の重要性を強調している。

結論

DeepDiveRは、化石から生物多様性を推定するための科学者にとって使いやすいツールだ。現代の多様性に基づく条件付けやシミュレーションパラメータの自動調整などの新機能により、分析の正確性と効率が向上している。研究者たちがこのパッケージを使ってさまざまな生物群を調査することで、地球の歴史を通じて生命がどのように変わってきたかの理解が深まる。

オリジナルソース

タイトル: DeepDiveR - A software for deep learning estimation of palaeodiversity from fossil occurrences

概要: O_LIThe incompleteness of the fossil record, in particular variation in preservation and sampling through space and time, presents a barrier to estimating changes in biodiversity which standard statistical methods struggle to account for. C_LIO_LIHere we present DeepDiveR, an R package for the DeepDive program enabling estimation of biodiversity from fossil occurrence data. The method uses a simulation-trained deep neural network to generate predictions of biodiversity change through time, while accounting for temporal, spatial and taxonomic heterogeneities in preservation. C_LIO_LIDeepDiveR can be readily used to explore the extinct biodiversity of different clades. We demonstrate the pipeline to build and customise analyses, including consideration of changes in biogeography. We also further develop the model to integrate information about modern diversity in the case of extant clades and introduce a function that automatically adjusts the parameterization of the simulations to generate training data that reflect the distribution of empirical datasets. C_LIO_LITo demonstrate the software, we analyse the fossil record of the order Carnivora through the Cenozoic, finding a peak in diversity in the Late Miocene and a 37% species loss since the Pleistocene. Our implementation includes the generation summary statistics and plots that allow for an evaluation of the model performance and diversity estimations and a configuration file that captures all parameters required to guarantee the full reproducibility of the results. C_LI

著者: Rebecca Brown Cooper, B. J. Allen, D. Silvestro

最終更新: 2024-09-06 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.03.610960

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.03.610960.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事