ポリプloid植物ゲノムの進展
新しいバイオインフォマティクスツールが多倍体植物とその系統の分析を強化する。
― 1 分で読む
目次
ポリプロイディーっていうのは、生物が2セット以上の染色体を持ってる状態のこと。これは植物でよく見られる現象で、彼らの進化に大きな役割を果たしてるんだ。最近の研究によると、約35%の維管束植物がポリプロイディーのイベントから生まれたらしい。遺伝学や進化についての理解が進んでも、ポリプロイディーを研究するのは難しいままで、特に進化の関係を探る系統学の分野ではね。
ポリプロイディー種の分析の難しさ
ポリプロイディー植物の遺伝データを分析する時、研究者たちは特に異種のハイブリッドから生まれるアロポリプロイドと呼ばれるものを扱う時に難しさに直面することが多い。大きな課題の一つは、親種から来ている遺伝子の異なるバージョン、すなわちアリルを特定することなんだ。遺伝データを分析するために使われるほとんどのバイオインフォマティクスツールは、元々ヒトみたいな二倍体生物用に設計されてて、ポリプロイドの遺伝情報を簡素化して扱うことが多い。これが正確でない結果を招いたり、ポリプロイディーとその起源の本質を曖昧にしちゃうんだ。
ポリプロイディー植物種をよりよく理解するために、科学者たちはこれらの生物に存在する複雑な歴史と変異を反映したデータで作業する必要がある。その方が異なる種の関係を正しく特定できて、どのように進化したのかを理解する助けになるんだ。
遺伝データのフェイジングの重要性
フェイジングっていうのは、ポリプロイド生物の遺伝子がどの親種から来ているのかを判別するプロセスのことだ。これは彼らの進化の歴史を正確に再構築するために重要で、特に少数の遺伝マーカーを見ている時にね。以前の研究でもフェイジングが重要だってことが示されてるけど、フェイズデータと非フェイズデータを使ったポリプロイディーの歴史研究の影響を徹底的に探求した研究はなかったんだ。
新しいバイオインフォマティクスパイプラインの紹介:PATÉ
ポリプロイディーの遺伝データ分析の課題に取り組むために、PATÉっていう新しいパイプラインが開発された。このツールは、親系統をサンプリングすることなくポリプロイド生物の遺伝データをフェイズできるように設計されてる。これは特定のゲノムの領域を孤立させて配列決定する手法であるターゲットエンリッチメントデータで動作するために作られたんだ。
新しいパイプラインはスケーラブルで、たくさんの個体や大規模なデータセットを扱えるんだ。先進的なフェイジングアルゴリズムを使用することで、PATÉはポリプロイドからフェイズハプロタイプ配列を回復することで、研究者により正確な遺伝配列を提供できる。
フェイジングにおけるターゲットエンリッチメントの重要性
ターゲットエンリッチメントは広範囲な系統ゲノムデータセットを収集するための一般的な手法なんだ。この技術は特定の遺伝子や興味のある領域に焦点を当てることで、複雑な植物群の進化の歴史に関する洞察を得ることができる。研究者が特定のゲノムの部分を孤立させて配列決定できるようにするために、ターゲットエンリッチメント用の多くのプローブキットが開発されてる。
だけど、こういったデータセットを生成するために使われる多くの既存の方法は、二倍体生物用に設計されていてポリプロイド種にはうまく機能しない。これが後の分析の正確性に関する懸念を引き起こすんだ。
フェイズデータがポリプロイド分析を改善する方法
フェイズデータは、異なる種の関係についてより明確な情報を提供することでポリプロイド種の分析を改善できる。フェイズデータを使用すると、研究者はアロポリプロイディーやオートポリプロイディーなどの異なるタイプのポリプロイディーをよりよく区別できるようになるし、新しい種の形成に関与する親系統を特定するのにも役立つんだ。
さらに、フェイズデータを使うことで、分岐時間のより良い推定ができて、種の関係を示す系統ネットワークの正確な再構築が可能になる。こういった洞察は、植物の進化の複雑さを理解するためには必須なんだ。
フェイジングの分岐時間推定における役割
分岐時間の推定は、種がどのように進化してきたのかを理解するための重要な側面なんだ。フェイズデータを使用することで、ハイブリダイゼーションイベントがいつ起きたのかのより正確な推定ができる。例えば、フェイズデータを使うと、一部の種の分岐時間を若く見積もることができて、進化の歴史をよりよく理解できるようになる。
一方で、非フェイズデータは古いまたは正確でない推定に繋がる傾向がある。この違いは、ポリプロイド植物を研究する時はできるだけフェイズデータを使う必要性を浮き彫りにしてるんだ。
PATÉパイプラインの効果をDryopterisシダ複合体でテスト
PATÉパイプラインの効果を試すために、研究者たちは北アメリカのよく研究されたシダ類のグループ、Dryopterisにこれを適用した。このグループには、ハイブリダイゼーションイベントから形成されたことが知られているいくつかの種が含まれてる。
新しいターゲットエンリッチメントデータを使って、研究者たちはDryopterisの種のためにフェイズ遺伝配列を生成した。テストの結果、パイプラインが高品質なフェイズデータを回復でき、グループ内の複雑な進化関係の分析が可能であることが示されたんだ。
四つのテスト:Dryopteris種間の関係を探る
研究者たちは、Dryopteris複合体内の異なる種間の関係をどれだけフェイズデータが解決できるかを評価するために、四つのテストを行った。
三種テスト
最初のテストは、三つの種、つまり二つの二倍体親と彼らの推定ハイブリッドの子孫の関係に焦点を当てた。結果はハイブリダイゼーションが起こったことを支持するもので、フェイジングがポリプロイドシステム内の関係を明確にできることを強化するものだった。
九種テスト
二つ目のテストは、九つのDryopteris種の関係を調べた。この分析ではいくつかの網状現象が明らかになり、種間のハイブリダイゼーションや遺伝子流動の事例を示してる。結果は、フェイズデータが非フェイズデータに比べて明確な種間の関係への洞察を提供することを示した。
フェイズデータ使用の利点
研究者たちは、フェイズデータを分析に使用することで、種間の関係についての推定の正確さが向上し、ハイブリダイゼーションイベントへの明確な洞察が得られ、分岐時間のより良い推定ができることを発見した。
複雑なネットワーク推定におけるフェイジングの限界
フェイジングには明らかな利点がある一方で、課題もあるんだ。深く分岐した親系統はフェイジングプロセスを複雑にしてエラーを引き起こすことがある。また、いくつかのネットワークは網状進化の固有の複雑さから、正確に推定するのが難しい場合もあるんだ。
結論:植物進化研究におけるフェイジングの未来
フェイジングはポリプロイド植物の複雑な進化の歴史を研究するための貴重なアプローチだ。PATÉみたいなツールの開発は、研究者が植物系統内の関係、ハイブリダイゼーションイベント、分岐時間について深い洞察を得るための有望な機会を提供してくれる。高品質なフェイズゲノムデータが増えていくにつれて、ポリプロイディーの植物進化における役割の理解はさらに深まるし、最終的には植物の多様性と歴史の知識が向上していくんだ。
ポリプロイドデータを分析するための方法を継続的に改善し、深い分岐や網状進化に関連する課題に取り組むことは、植物進化研究を進める上で重要なんだ。この継続的な作業は、ポリプロイド植物種の複雑な歴史を正確に再構築するための強力なツールと戦略の必要性を強調しているんだ。
タイトル: Benefits and Limits of Phasing Alleles for Network Inference of Allopolyploid Complexes
概要: Accurately reconstructing the reticulate histories of polyploids remains a central challenge for understanding plant evolution. Although phylogenetic networks can provide insights into relationships among polyploid lineages, inferring networks may be hindered by the complexities of homology determination in polyploid taxa. We use simulations to show that phasing alleles from allopolyploid individuals can improve phylogenetic network inference under the multispecies coalescent by obtaining the true network with fewer loci compared to haplotype consensus sequences or sequences with heterozygous bases represented as ambiguity codes. Phased allelic data can also improve divergence time estimates for networks, which is helpful for evaluating allopolyploid speciation hypotheses and proposing mechanisms of speciation. To achieve these outcomes in empirical data, we present a novel pipeline that leverages a recently developed phasing algorithm to reliably phase alleles from polyploids. This pipeline is especially appropriate for target enrichment data, where depth of coverage is typically high enough to phase entire loci. We provide an empirical example in the North American Dryopteris fern complex that demonstrates insights from phased data as well as the challenges of network inference. We establish that our pipeline (PATE: Phased Alleles from Target Enrichment data) is capable of recovering a high proportion of phased loci from both diploids and polyploids. These data may improve network estimates compared to using haplotype consensus assemblies by accurately inferring the direction of gene flow, but statistical non-identifiability of phylogenetic networks poses a barrier to inferring the evolutionary history of reticulate complexes.
著者: George P. Tiley, A. A. Crowl, P. S. Manos, E. B. Sessa, C. Solis-Lemus, A. D. Yoder, J. G. Burleigh
最終更新: 2024-04-28 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2021.05.04.442457
ソースPDF: https://www.biorxiv.org/content/10.1101/2021.05.04.442457.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。