Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

リファレンスシーケンスブラウザでeDNA研究を強化する

新しいツールが環境DNAの参照配列の検索を簡単にして、研究者たちを手助けしてるよ。

― 1 分で読む


eDNA研究ツールの効率化eDNA研究ツールの効率化アクセスが簡単になったよ。新しいブラウザで重要なDNA参照配列への
目次

環境DNA(EDNA)って、直接生物からじゃなくて、環境サンプルから得られる遺伝子材料のことなんだ。この技術は、生態学、保全生物学、さらには古代生物の研究なんかでも注目されてる。eDNAを使うことで、科学者たちはいろんな種について非侵襲的に情報を集められるんだ。特に水中の生物を観察するのが難しい環境では、従来の方法よりも大きな利点があるよ。

eDNAの仕組み

eDNAを使うプロセスは、まず環境から水や土壌をサンプルとして集めるところから始まる。科学者たちは、これらのサンプルからDNAを抽出して、さまざまな生物の存在を明らかにするんだ。抽出したDNAはポリメラーゼ連鎖反応(PCR)という手法で調べられて、異なる種を特定する手助けをする。PCRにはいくつかの技術があって、特定の種を狙うものもあれば、DNAメタバーコーディングって言われる手法でサンプル内の多くの種を評価するものもある。

eDNAを効果的に使うためには、参照DNA配列の存在が重要だよ。これらの配列は、公開データベースに保存されていて、環境サンプルを知られている種と照合するために役立つ。でも、まだ多くの生物がこれらの参照配列を持っていないから、eDNAの方法の効果が限られちゃうんだ。

eDNA研究の課題

科学者たちは、必要な参照配列を見つけるのに苦労することが多いんだ。公開データベースから配列をダウンロードするのは面倒で時間がかかるから、適切なデータを探すのに数日もかかることがある。プロジェクトが遅くなっちゃうこともあるんだ。中には、コンピュータープログラムを書いて手助けする科学者もいるけど、プログラミングスキルを持ってる人は少ないんだよね。

それに、生態学者はデータ分析やコンピュータープログラミングの訓練をあまり受けていないから、大量の配列データを効率よく扱うのが難しいんだ。関連する分野の学部生たちも、eDNA情報を分析するためのプログラミングの正式な訓練を受けていないことが多いんだ。

参照配列ブラウザ(RSB)の導入

こういった問題に対処するために、参照配列ブラウザ(RSB)っていう新しいツールが開発されたんだ。これは使いやすいアプリで、科学者たちはNCBIやBOLDみたいな重要なデータベースから参照配列を検索してダウンロードできるんだよ。

RSBは、検索プロセスを簡素化するグラフィカルインターフェースを提供していて、研究者が必要な情報を見つけやすくしてるんだ。ユーザーは自分のデータをアップロードして、インターフェースを使って検索パラメーターを調整できるよ。検索が終わると、結果の概要が表示されて、配列や必要な情報をダウンロードするオプションもある。

RSBの使い方

RSBはいくつかのセクションに分かれてて、各セクションが異なる参照データベースに対応してるから、ユーザーは簡単にナビゲートできるんだ。ユーザーは検索パラメーターを含むファイルをアップロードできるけど、必須じゃないんだ。ただし、広範囲の検索にはアップロードをおすすめするよ。

検索を実行すると、RSBは結果の概要表を表示するんだ。この表には、各生物に対して見つかった配列の数が表示されて、データのギャップも強調されるよ。

さらに、RSBには生物名のエラーを自動修正する機能もあって、重要なデータを見逃す可能性を減らしてくれるんだ。ユーザーは概要表をダウンロードして、検索結果をさらに分析できるよ。

RSBの特徴

RSBはカバレッジマトリックスを提供していて、ユーザーがどれだけデータがニーズを満たしているかを視覚化するのに役立つんだ。各行は異なる生物を表し、各列は特定のDNAバーコードに対応してる。表の中の数字は、各生物-バーコードペアに対してどれだけの配列があるかを示してる。これにより、ユーザーはデータが不足している場所をすぐに特定できて、検索を調整できるんだ。

CRUXデータベースの特徴

RSBのCRUXデータベースセクションは、特定の生物のための参照配列を調べることに特化してる。科学者たちに、どれだけの配列があって、どの分類学的レベルでデータが見つかるかを示してくれるんだ。直接一致がない場合は、RSBがより広い分類学的レベルで関連する配列を探すか、存在しないことを確認するまで検索を続けてくれる。この機能は、研究者が公共データベースに頼れるかどうかを評価するのに役立つよ。

NCBIデータベースの特徴

RSBのNCBI部分では、特定の生物とバーコードのための既存の配列データを調べられるんだ。このセクションでは、ユーザーが生物の名前を入力して、検索したいバーコードを指定できるよ。検索が終わると、RSBは見つかった配列の数を表示して、データをダウンロードするオプションも提供する。ここでも、配列の長さ要件を指定できて、不関連な結果をフィルタリングできるんだ。

BOLDデータベースの特徴

RSBのBOLDセクションは遺伝子バーコードのカバレッジに焦点を当てていて、ユーザーが興味のある種を検索できるようになってる。ユーザーはファイルをアップロードするか、ツールに直接種のリストを入力できるよ。検索を実行したら、RSBが参照配列を持っている種を表示して、原産国などの要因に基づいて結果をフィルタリングできるんだ。このフィルタリングは、NCBIで既に見つかったデータと重複しないユニークな配列を得るのに役立つよ。

RSBの利用例

RSBは、eDNAを研究している科学者たちにとって、さまざまな実用的なアプリケーションがあるよ。ここに二つの重要な例を挙げるね:

1. 参照配列の利用可能性確認

eDNA研究を始める前に、研究者たちは調べている種のための参照配列が利用可能かどうかを確認する必要があるんだ。RSBを使えば、各種に対してどれだけの配列があるかをすぐに確認できるよ。この情報は、メタバーコーディング研究や特定の種に特化した新しいプライマーを設計するために重要なんだ。概要表やカバレッジマトリックスを分析することで、研究者たちは対象生物を十分にカバーしているバーコードを見つけたり、他の場所で配列を探す必要があるかどうかを判断できるよ。

2. ローカル参照データベースの作成

オンラインの参照を評価した後、科学者たちは自分の研究のために関連する配列のローカルデータベースを作りたいと思うかもしれない。RSBは、NCBIやBOLDからの配列を簡単にダウンロードできるから、このプロセスを効率化してくれるよ。配列はさまざまな整列ツールと互換性のある形式で保存できるから、後でデータを分析しやすくなるんだ。

結論

参照配列ブラウザ(RSB)は、環境DNAの研究者が直面する多くの課題に対処する革新的なツールなんだ。参照配列の検索とダウンロードプロセスを簡素化することで、RSBは科学者たちが時間を節約して核心的な研究に集中できるように助けてくれる。RSBには限界もあるけど、eDNA研究を強化できる価値ある機能を提供していて、科学者たちが必要なデータにアクセスしやすくなるんだ。このツールは、生態学的研究と進化するバイオインフォマティクスの分野とのギャップを埋めるための重要な一歩を表しているよ。

オリジナルソース

タイトル: Reference Sequence Browser: An R application with a User-Friendly GUI to rapidly query sequence databases

概要: Land managers, researchers, and regulators increasingly utilize environmental DNA (eDNA) techniques to monitor species richness, presence, and absence. In order to properly develop a biological assay for eDNA metabarcoding or quantitative PCR, scientists must be able to find not only reference sequences (previously identified sequences in a genomics database) that match their target taxa but also reference sequences that match non-target taxa. Determining which taxa have publicly available sequences in a time-efficient and accurate manner currently requires computational skills to search, manipulate, and parse multiple unconnected DNA sequence databases. Our team iteratively designed a Graphic User Interface (GUI) Shiny application called the Reference Sequence Browser (RSB) that provides users efficient and intuitive access to multiple genetic databases regardless of computer programming expertise. The application returns the number of publicly accessible barcode markers per organism in the NCBI Nucleotide, BOLD, or CALeDNA CRUX Metabarcoding Reference Databases. Depending on the database, we offer various search filters such as min and max sequence length or country of origin. Users can then download the FASTA/GenBank files from the RSB web tool, view statistics about the data, and explore results to determine details about the availability or absence of reference sequences.

著者: Samuel L Rapp, S. Ramesh, J. Tapias Gomez, B. Levine, D. Tapias-Gomez, D. Chung, Z. Truong

最終更新: 2024-07-29 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2023.09.20.558722

ソースPDF: https://www.biorxiv.org/content/10.1101/2023.09.20.558722.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事