Simple Science

最先端の科学をわかりやすく解説

# 生物学 # 生物情報学

新しいデータセットが脊椎動物の多様性のトレンドを明らかにしたよ。

脊椎動物の5つのグループに関する多様化指標の研究データセットが公開された。

Juan Daniel Vasquez-Restrepo

― 1 分で読む


脊椎動物多様性データセット 脊椎動物多様性データセット が公開されたよ ンに共有された。 種の多様化指標に関する新しい洞察がオープ
目次

生物多様性に関する研究は主に裕福な国々に支配されてきたんだ。これは彼らが資金や技術にアクセスできるからだね。でも最近、もっと多くの研究者や機関がオープンサイエンスの方針を推進してる。この方針は、特に資金や技術リソースが不足している地域で、科学的知識をみんなに提供しようとするものなんだ。データや研究をもっと自由に共有することで、科学が進歩して、より多くの人に利益をもたらすことができるんだ。

ここ数年、データペーパーが科学雑誌でかなり一般的になってきた。これらのペーパーは、他の研究者が必要とする情報を提供するための重要なデータを示していて、自分で集めることに焦点を当てていない研究者にとっては助けになるんだ。これにより、研究者は時間を節約できて、コストも削減できるよ。いい例として、WorldClimデータセットがあり、リリース以来20,000回以上引用されているんだ。

この研究は、5つの主要な脊椎動物グループの多様化メトリクスに関するデータセットを提供することを目的としている。種の存在の有無を示すマトリックスが含まれてるんだ。このデータを生成するにはかなりの計算能力と高度なプログラミングスキルが必要だから、マクロエコロジーやマクロ進化の分野に興味がある人には貴重なデータセットになるよ。このデータは好奇心からの分析中に集められたもので、コミュニティと共有することを意図している。データセットの簡単な説明は提供されるけど、観察された生物多様性のトレンドの背後にある理由の詳細な分析は行わない予定だ。

データ収集

系統発生的サンプリング

このプロジェクトでは、両方の系統樹を完全にサンプリングした時系列のスーパーツリーを5つの脊椎動物グループに使用した。両生類、爬虫類、鳥類、哺乳類、サメだね。これらの系統樹はさまざまなソースから集められていて、オンラインで利用できるよ。これらの系統はDNAを持つ種と持たない種から組み合わされているから、データが常に単純ではないこともある。こうした不確実性を考慮するために、各グループに対して100個のランダムな系統樹を選んだんだ。

多様化率

異なるグループが時間とともにどのように進化するかを比較するために、多様化率を計算するための2つの異なる方法が使われた。一つはDivRateと呼ばれ、種の出現率を単純に推定するもの。共通の祖先からどれだけの種が出現するかを測定するんだ。もう一つの方法BAMMは、時間とともに異なる進化率を許可する複雑なアプローチを使っている。

分析では、各脊椎動物グループに対して100個の系統樹を両方の方法で研究した。計算の要求が大きいため、高性能サーバーで分析を行ったよ。その結果は、正確性を保証するために特定のソフトウェアで処理された。大量のデータが関与しているため、すべての分析を実行するのに約6ヶ月かかったんだ。

存在-不在マトリックス

データをさらに整理するために、IUCNレッドリストの配布ポリゴンを利用して存在-不在マトリックスが作成された。これは生物多様性データのよく知られたリソースだよ。両生類、爬虫類、哺乳類、サメには最も最近のデータセットが使われた。一方、鳥類には以前のデータセットが参照された。ポリゴンの無効なジオメトリは、存在-不在マトリックスを生成する前にGISソフトウェアを使用して解決されたんだ。

タクソノミー調整

一貫性を確保するために、各種のために全球生物多様性情報施設(GBIF)からのユニークな識別子が含まれた。これらの識別子は、時間の経過による名前の変更に関係なく種を追跡するのに役立つんだ。種名の一致は、GBIFの組み込みツールを使用して行われ、正確な一致またはわずかな違いを通じてさまざまな名前を整合させる試みがなされた。一部の種は一致できなかったから、より正確に種名を照合するために追加の手段が使われたよ。

結果

収集されたデータに基づいて、各脊椎動物グループの多様化率は似たような遅い率を示し、一般的な傾向が観察された。しかし、異なるメトリクスは異なる結果を提供し、BAMMは変動が少なかった。データに不確実性があるにもかかわらず、分析した3つのメトリクスのうち2つで種の出現率は一貫していたよ。

存在-不在マトリックスは、生物多様性のパターンをうまく特定し、熱帯地域で種の豊富さが高いことを示した。さまざまな地域間での種の豊富さにはわずかな違いがあり、知られている多様性のパターンを反映しているんだ。合計で、データセット間で共通の種がかなりの数あったよ。

地理的パターン

多様化率の地理的パターンは、使用する方法によって異なることがある。たとえば、BAMM方法では特定の地域における両生類の高い種の出現率が示されたが、DivRate方法では異なる傾向が見られた。爬虫類も使用したメトリクスによって結果が異なったよ。哺乳類の場合、BAMMは熱帯地域の海洋種での高い率を示し、DivRateは特定の大陸地域での高い率を反映した。

鳥類のパターンは種の出現率がより均等に分布しているが、特定の地域でのピークも見られた。サメに関しては、BAMM方法が全体的に低い率を示した一方で、DivRateは海洋地域での高い率を示したんだ。

議論

このデータセットは同様のものの中で初めてではないけど、研究にオープンに利用できるしっかり整理されたデータのコンパイルを提供しているんだ。これはマクロエコロジーやマクロ進化のパターンに関する洞察を提供できるし、異なる種が時間とともにどのように進化するかを理解するために重要なんだ。このデータセットを使って研究者が多様化率と地理的または気候的データを結びつけて、より広いスケールでパターンを探すことができるよ。

でも、データを分析する際には、その右に偏った性質を考慮することが重要だよ。平均を取ると誤解を招く解釈につながるかもしれないから、中央値や相対的な測定を使うとより正確な結果が得られるかもね。さらに、データの提示方法はその解釈に影響を与えるから、特に変動範囲が小さい場合は注意が必要だよ。

使用されるメトリクスは、出版日などのさまざまな要因によって分類が異なる可能性があることを忘れないでね。研究者は、このデータセットを使用する際に種の分類を調和させることが推奨されている。提供されたユニークIDは、この点で大いに役立ち、異なるデータセット間で種を照合しやすくするんだ。

結論

この脊椎動物の多様化メトリクスに関するデータセットは、研究者にとって貴重なリソースになるよ。データを適切に分析して解釈すれば、生物多様性のパターンやそれを促進するプロセスについての洞察を得ることができるんだ。目的は、研究を助けて、マクロエコロジーやマクロ進化の分野でのさらなる探求を促進することだよ。ユーザーは、今後の研究での最大限の活用のために、データの方法論や解釈に慣れ親しむことを勧めるよ。

オリジナルソース

タイトル: A dataset containing speciation rates, uncertainty, and presence-absence matrices for more than 34,000 vertebrate species

概要: The increasing availability of phylogenetic data has facilitated the exploration of macroecological and macroevolutionary patterns across diverse spatial and temporal scales. However, calculating some model-based diversification metrics often requires significant computational power and time. To address this, I present a comprehensive dataset of Bayesian diversification rates for over 34,000 vertebrate species, spanning five major groups: amphibians, birds, mammals, reptiles, and sharks. This is the first large-scale dataset of its kind, providing both continuous and binary data for speciation rates and presence-absence matrices, respectively, with global coverage. The dataset not only enables analyses of evolutionary and spatial diversity patterns but also democratizes access to data-intensive studies. Additionally, as it is based on Markov chains, the dataset can be customized and extended without the need to start from scratch, offering flexibility for future research on diversification dynamics.

著者: Juan Daniel Vasquez-Restrepo

最終更新: 2024-12-02 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.09.588748

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.09.588748.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事