Simple Science

最先端の科学をわかりやすく解説

# 生物学# 進化生物学

種の関係を分析する新しい方法

新しいアプローチが、種のつながりに影響を与える信頼できない遺伝データを特定した。

― 1 分で読む


種の分析の新しい方法種の分析の新しい方法特定。種間関係における信頼できない遺伝データの
目次

生物同士の関係を研究する時、科学者はたくさんの遺伝子やDNAの断片を分析するんだ。これでいろんな種の関係がわかるんだけど、遺伝子をたくさん使っても、結果が混乱したり信用できなかったりすることがあるんだ。データのちょっとした変化が、種の関係に関する全然違う結論につながることもある。この文章では、こうした関係を研究する際の課題について話していて、問題を引き起こしている遺伝子を特定する新しい方法を紹介してるよ。

系統ゲノム学の課題

研究者たちは系統解析っていう方法を使って、種の関係を見てる。大量の遺伝データを集めて、時には数千の遺伝子を含め、どの種がより近いのかを探るんだ。このアプローチは有望に見えるけど、うまくいかないこともある。データの中の一つの遺伝子を取り除くだけで、関係の全体像がまったく違って見えることもあって、これが全ての遺伝データが同じくらい信用できるわけじゃないことを示唆してるんだ。

多くの研究で特定の遺伝子や配列が結果を歪めることがわかったよ。こういった問題のある配列は、似てるけど違う遺伝子から来てたり、解析に使ってる全体的な遺伝モデルに合わなかったりするんだ。だから、一部の種の関係は本当に安定してないデータから引き出されてるかもしれない。

外れ値の配列とその影響

たくさんの遺伝子を使うことで、いくつかの問題のある配列の影響が薄まるという考えは理にかなってるけど、実際にはそうじゃないことが証明されてるんだ。外れ値の配列は、データから得られる結論に大きな影響を与えることがある。これが少数の例に限ったことじゃなくて、いろんな研究で頻繁に起こってるんだ。

研究者たちは、どの具体的な遺伝子や種がこれらの不正確さを引き起こしているのかを見つけるために頑張ってる。問題のある配列を特定するのは難しくて、時間がかかることもあるんだ。現在の方法は、種の間のさまざまな可能な関係を比較することが多いけど、このプロセスは遅くて手間がかかることがある。そして、問題を引き起こしている特定の配列を必ずしも特定できるわけじゃない。

分析のための新しい方法

これらの課題に対処するために、進化的スパース学習(ESL)っていう新しい方法が開発されたよ。このアプローチは、見かけ上の関係がそれほど近くないかもしれない弱いクレード-種のグループ-を再分析せずに見つけることを目指してるんだ。

ESLは、特定の配列が特定のグループの種の有無に一致するかどうかを見るモデルを作るんだ。方法では、解析に含まれる遺伝子やサイトの数を制限するためにペナルティを使用する。こうすることで、ESLは研究されてるグループの理解に本当に貢献している配列を特定できるんだ。

脆弱なクレードを調査する

ESLモデルの初期テストでは、多くのモデルがグループ内の種を高い信頼性で分類しなかったことがわかった。これは驚きだった、特に使用された遺伝データが大量だったから。結果として、新しいメトリックが導入されて関係をよりよく理解する助けになった。

これらのメトリックの一つは、遺伝子が関係について提供する信号の合意や対立を探すもの。別のメトリックは、種のグループが本当に近い関係にある確率を評価するんだ。新しいメトリックを使うことで、科学者たちはより大きな系統樹の中で脆弱に見える種のグループを特定できるようになったよ。

DrPhylo: 研究者のための新しいツール

DrPhyloは、研究者がESLメソッドを適用してデータを迅速に分析できるようにするために設計されたソフトウェアツールなんだ。ユーザーはデータを入力して設定を指定し、脆弱なクレードやそれに関連する影響力のある遺伝子-種の組み合わせを特定するための分析を実行できるんだ。

DrPhyloは、さまざまなタイプの遺伝データを扱えて、使いやすいよ。研究者は結果を視覚化できるから、どの遺伝子が種の関係を支持したり矛盾したりしているのかを見るのが簡単になるんだ。

藻類研究におけるDrPhyloの応用

DrPhyloの能力を示すために、研究者たちはそれを真菌に関するデータセットに適用したよ。以前に脆弱な関係を示していたいくつかの真菌のグループを分析したんだ。DrPhyloは、種がどのようにグループ化されるかに影響を与える特定の遺伝子を特定したんだ。

例えば、ある分析では、7W9S51っていう遺伝子が特定の真菌のグループを強く支持しているのが見つかった。でも、別の遺伝子、7TN012は矛盾する信号を提供してた。これが関係の脆さを強調して、種の関係を評価する時に個々の遺伝子を調べる重要性を示してるんだ。

植物と動物の系統からの洞察

DrPhyloは真菌だけに限らないんだ。研究者たちは植物や動物のデータセットにも適用したよ。植物の関係の研究では、DrPhyloが特定の植物種が思っていたほど近くないという問題を明らかにするのを助けた。データを分析すると、いくつかの種が以前の考え方よりも近くないことがはっきりしたんだ。

齧歯類に関する動物の研究では、DrPhyloがデータ内の脆弱なクレードを特定した。具体的には、いくつかの種が提案された関係を支持していないことを指摘して、分析の潜在的な不正確さを晒したんだ。

問題のある配列を特定する重要性

これらの問題のある遺伝子-種のペアを見つけることは、研究者にとって非常に重要だよ。これによって、彼らは分析を洗練させ、結論の信頼性を向上させることができるから。DrPhyloのようなツールを使えば、科学者たちは種の関係についてより明確なイメージを得ることができて、新しい生物学的洞察が発見できるかもしれない。

結論

遺伝データを通じて種の関係を研究するのは複雑で、しばしば課題があるんだ。問題のある配列が不一致な結果を引き起こすことがあるから、研究者たちはこれらの問題を特定して軽減するための効果的な方法を見つける必要があるんだ。ESLのような方法や、DrPhyloのようなツールが導入されることで、科学者たちはこの目標を達成するための貴重なリソースを得られるんだ。

研究者たちが地球上の多様な生命を探求し続ける中で、遺伝データを通じて種の関係のニュアンスを評価し理解する能力は非常に重要になるよ。外れ値の配列によって引き起こされる課題に取り組んで、正確な系統解析を促進することで、私たちは生命の樹についてのより完全な理解に近づいてるんだ。

オリジナルソース

タイトル: Discovering Fragile Clades And Causal Sequences In Phylogenomics By Evolutionary Sparse Learning

概要: Phylogenomic analyses of long sequences, consisting of many genes and genomic segments, infer organismal relationships with high statistical confidence. But, these relationships can be sensitive to excluding just a few sequences. Currently, there is no direct way to identify fragile relationships and the associated individual gene sequences in species. Here, we introduce novel metrics for gene-species sequence concordance and clade probability derived from evolutionary sparse learning models. We validated these metrics using fungi, plant, and animal phylogenomic datasets, highlighting the ability of the new metrics to pinpoint fragile clades and the sequences responsible. The new approach does not necessitate the investigation of alternative phylogenetic hypotheses, substitution models, or repeated data subset analyses. Our methodology offers a streamlined approach to evaluating major inferred clades and identifying sequences that may distort reconstructed phylogenies using large datasets.

著者: Sudhir Kumar, S. Sharma

最終更新: 2024-04-29 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.26.591378

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.26.591378.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事