Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

GenomeDelta: DNAの変化を検出するツール

さまざまな種の最近のDNA変化や転移因子を見つける新しい方法。

― 1 分で読む


GenomeDeltaを使GenomeDeltaを使って遺伝子の変化を検出するを明らかにした。革新的なツールが最近の転移可能元素の侵入
目次

転移因子(TE)は、生命体のDNA内で自分自身をコピーできる小さなDNAの断片だよ。これらの要素は多くの生物に見られ、しばしばその遺伝子材料の重要な部分を占めてる。いくつかのTEは宿主にとって役立つかもしれないけど、ほとんどのTEは問題を引き起こして、有害なDNAの変化をもたらすんだ。

時間が経つにつれて、生物はTEに対抗するための複雑な防御方法を発展させてきたんだけど、しばしば小さなRNAを使うんだ。でも、TEはこの防御を回避する方法を見つけて、新しい種に移動することもあるんだ。これが簡単な生物の間で頻繁に起こるけど、最近の研究ではより複雑な生物でも起こることが示唆されてる。

通常、科学者たちはTEがある種から別の種に移動したことの間接的な兆候を特定するんだ。例えば、近縁の種が同じTEを混在して持ってると、一方の種が別の種からTEを受け取った可能性があるってことになる。また、異なる種で非常に似たTEを探すこともできる。でも、TEが最近広がった場合、古いサンプルと新しいサンプルのDNAを比較することで直接的な証拠を得ることもできるんだ。

有名な例はP因子で、1950年から1980年の間にショウジョウバエ(D. melanogaster)の個体群に広がったものだよ。1950年以前に集められたハエにはこの要素の痕跡が見られず、それ以降に集められたものには見られる。こんな最近の侵入は様々な種で一般的かもしれない。D. melanogasterでは、過去200年間に少なくとも11の異なるTEファミリーが侵入したんだ。他の種でも似たような急速な変化が起こってるかもしれない。

TE侵入の直接証拠

最近のTE侵入の明確な証拠を見つけるために、科学者たちは古いサンプルと新しいサンプルの両方を分析する必要があるんだ。新しいサンプルは生きている個体群から得られることが多いけど、古いサンプルは実験室の系統、博物館の標本、あるいは古代のDNAから取られることもある。技術が進歩するにつれて、より多くの種が配列解析されて、最近のTEの動きを見つけるチャンスが増えてる。

TE侵入の新たな特定方法は、通常古いサンプルと新しいサンプルの間で知られているTEの存在を比較することに焦点を当ててる。これには知られているTEの配列ライブラリが必要なんだけど、作成するのがすごく大変なんだ。たとえ特定の種のライブラリがあっても、最近広がったTEは含まれていないことが多いんだ。

たとえば、ショウジョウバエのために作られたTEライブラリには、1983年から1993年の間に広がったレトロトランスポゾンSpoinkについての情報が含まれていないんだ。そのライブラリを作成するために使われた参照はその前に収集されたからね。だから、Spoinkの侵入は発生した数年後にしか発見されなかったんだ。

GenomeDeltaの紹介

これらの課題に対処するために、GenomeDeltaっていう新しいツールが開発されたんだ。このツールは、あるサンプルに存在していて別のサンプルに存在しないDNA配列を特定することを目的としてるんだ。つまり、以前のライブラリに関する知識なしで最近のTE侵入に関連する配列を直接見つけることができるんだ。

GenomeDeltaの主なコンセプトは、最近のTE侵入が古いサンプルと新しいサンプルのDNAを比較すると隙間を作るってことだ。科学者たちが最近のサンプルの完全なDNAを古いサンプルの短いリードのデータセットと比較すると、TEが挿入された隙間を特定できるんだ。

GenomeDeltaは、新しいサンプルに対して高品質なDNAアセンブリを必要とし、古いサンプルからの短いリードデータも必要なんだ。最近のサンプルに存在し、古いサンプルに欠けている配列を特定するよ。

この方法は、地理的地域ごとに異なる分布を示す配列も検出できるんだ。ツールを検証するために、シミュレートデータと実データの両方を使ってテストされて、研究者たちは独自の生物学的洞察を明らかにすることができたんだ。

GenomeDeltaの仕組み

このツールは、古いサンプルからのDNAリードを処理し、それを新しいサンプルのDNAに対して整列させることで動作するんだ。この整列が完了すると、古いサンプルに対応するリードのない、新しいサンプル内のカバレッジの隙間を特定するの。

隙間を特定した後、配列を抽出して、類似性でグループ分けして、複数配列アライメントを作成するんだ。その後、GenomeDeltaはコンセンサス配列を生成して、新しいサンプルに特有の配列を報告するよ。

出力は主に二つのファイルからなってる。ひとつは反復要素に関連する配列用、もうひとつは非反復要素用だ。特定された配列の特徴、例えばコピー数や長さの概要も提供されるよ。

GenomeDeltaのアプリケーション

GenomeDeltaの主な使用法のひとつは、新しいTE侵入を特定することだ。このツールは、最近のサンプルで現れた新しい配列を明らかにできるけど、古いサンプルには存在しなかったものであり得る。また、ある地理的地域に存在しているが、別の地域には無い配列も明らかにできるんだ。

例えば、コアラのレトロウイルス(KoRV)の挿入は北の個体群に見られるけど、南の個体群には見られない。GenomeDeltaは、様々な地理的場所からのDNAを比較することでこのような違いを特定するのに役立つんだ。

シミュレートデータと実データでのGenomeDeltaの検証

その正確性を確認するために、GenomeDeltaはシミュレートデータと実サンプルの両方を使って検証されたんだ。シミュレートデータのテスト中に、研究者たちは参照配列を作成し、知られているTEを挿入したんだ。それから、リードをランダムに生成してGenomeDeltaがそれらのTEを正確に検出できるか確認したの。結果は、データに十分なカバレッジがあったときにGenomeDeltaが正しくこれらの挿入を同定できたことを示したんだ。

実データの場合、GenomeDeltaはショウジョウバエとコアラに適用されたんだ。科学者たちは異なる歴史的な期間の系統を比較して、GenomeDeltaが既知のTE侵入を見つけられるか確認したの。結果は、ショウジョウバエとコアラの両方でいくつかのTEを成功裏に特定できたことで、実際のシナリオでの効果を確認したんだ。

新しい生物学的洞察の発見

GenomeDeltaを使った研究は、TEの研究で重要な発見につながったんだ。例えば、これまで報告されていなかったショウジョウバエでの3つの新しいTE侵入を見つけたの。1800年代初頭に収集されたサンプルと2016年のサンプルのDNAを整列させることで、研究者たちは既に知られていたTEを確認しただけでなく、新しいものも特定できたんだ。

さらに例を挙げると、GenomeDeltaは植物病原体のZymnoseptoria triticiで新しいTEであるRosettaを発見したんだ。このTEの存在は異なる地理的場所で変わり、水平伝達やその他の要因に関連している可能性があることを示しているんだ。

GenomeDeltaの利点と限界

GenomeDeltaはTEを特定する従来の方法に対して大きな利点を提供してるんだ。既存の配列ライブラリが必要ないから、新しい予期せぬ侵入を見つけるのが簡単なんだ。この能力は、広範なバックグラウンド情報なしで遺伝的変化についての洞察を得ることを可能にするよ。

でも、いくつかの制限もあるんだ。例えば、GenomeDeltaは古いサンプルのリードカバレッジが平均よりも少なくとも5倍大きい場合に最も効果的に機能するんだ。カバレッジが低いと、結果が不完全になることがあるんだ。

さらに、GenomeDeltaは一つのサンプルに存在して別のサンプルに欠けている配列を特定することにのみ焦点を当ててるから、サンプル間で同じ配列のコピー数の変動を分析することはしないんだ。これは有用な洞察を提供できるかもしれないのにね。

最も重要な制限は、GenomeDeltaが最近のサンプルに高品質なDNAアセンブリを必要とすることだ。多くの歴史的標本のように、断片的なDNAしか得られないサンプルを分析するのは難しいんだ。だから、他の方法と同様に、高品質なアセンブリが成功した分析のためには必要不可欠なんだ。

結論

この研究では、サンプル間で存在の違いを示すDNA配列を検出することを目的としたツール、GenomeDeltaを紹介したよ。厳格な検証を通じて、GenomeDeltaは実際の例やシミュレートされたシナリオでも効果的であることが示されたんだ。

最近のTE侵入を検出し、地理的に異なる分布を持つ配列を特定することで、GenomeDeltaは広範な応用の可能性を秘めてるんだ。その柔軟性は、遺伝学、進化生物学、その他の分野での研究の新たな道を開いて、科学者たちが生物がどのように適応し、変化するかを探求することを可能にするよ。

オリジナルソース

タイトル: GenomeDelta: detecting recent transposable element invasions without repeat library

概要: To evade repression by the host defense, transposable elements (TEs) are occasionally horizontally transferred (HT) to naive species. TE invasions triggered by HT may be much more abundant than previously thought. For example, previous studies in Drosophila melanogaster found 11 TE invasions over 200 the past years. A major limitation of current approaches for detecting recent invasions is the necessity for a repeat-library, which is notoriously difficult to generate. To address this, we developed GenomeDelta, a novel approach for identifying sample-specific sequences, such as recently invading TEs, without prior knowledge of the sequence. It can thus be used with model and non-model organisms. As input, GenomeDelta requires a long-read assembly and short-read data. It will find sequences in the assembly that are not represented in the short read data. Beyond identifying recent TE invasions, GenomeDelta can detect sequences with spatially heterogeneous distributions, recent insertions of viral elements and recent lateral gene transfers. We thoroughly validated GenomeDelta with simulated and real data from extant and historical specimens. Finally, we demonstrate that GenomeDelta can reveal novel biological insights: we discovered the three most recent TE invasions in Drosophila melanogaster and a novel TE with a geographically heterogeneous distribution in Zymoseptoria tritici.

著者: Robert Kofler, R. Pianezza, A. Haider

最終更新: 2024-07-02 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.28.601149

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.28.601149.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事