Simple Science

最先端の科学をわかりやすく解説

# 生物学# ゲノミクス

教室でのロングリードシーケンシングの教え方

教育の場でロングリードシーケンシングを取り入れる新しいアプローチ。

― 1 分で読む


ロングリードシーケンシングロングリードシーケンシングトレーニング現代のゲノム技術で学生を支援する。
目次

ロングリードシーケンシングは、ゲノミクスにおいて重要なツールだよ。長いDNAシーケンスを生成できるから、繰り返しの多い遺伝子の複雑な部分を読み取るのに役立つんだ。ロングリードシーケンシングのコストが下がったことで、学校や研究室がさまざまな研究分野で使いやすくなったんだ。

ロングリードシーケンシングの人気の上昇は、2022年に大手科学雑誌で「今年の方法」として認められたときに注目された。この認識は、さまざまなゲノム研究における革新を浮き彫りにしているんだ。主な進展の中には、400万塩基を超える超長リードや、多くの研究プロジェクトに役立つ非常に正確な長リードが含まれているよ。

ロングリードシーケンシングは、人間の染色体の完全な組み立てに関する重要な発見に寄与していて、科学者たちは人間の遺伝子に対する深い洞察を得られるようになった。今では、真核生物の多様な生命体のシーケンシングにも実現可能な選択肢と見なされているんだ。

教室にロングリードシーケンシングを持ち込む

その大きな可能性にもかかわらず、学生にロングリードシーケンシングの使い方を教えるのはまだ難しいんだ。多くのトレーニングプログラムは依然としてショートリードシーケンシングに焦点を当てていて、研究は簡単な生物、例えばバクテリアに限定されていることが多い。特に非モデル生物に関する現代の研究の現実を反映したトレーニングを提供するのは、とても有益だと思う。

チリのある成功したトレーニングプログラムでは、学生たちがウネムシのゲノムを組み立てて分析し、より代表的なトレーニングの効果を示したんだ。しかし、こういった取り組みはまだ一般的ではなく、プロセス全体でさまざまな課題に直面している。

学生がDNAをシーケンスする前に、まず植物材料から高品質のDNAをしっかり抽出しなきゃならない。教室では、危険な化学物質や複雑な方法を使わずにこれを行う必要があって、高品質のDNAライブラリーを準備することも重要なんだ。DNAの質とライブラリーの準備は、シーケンシングの結果に影響を与えるよ。

ONT MinIONデバイスは教育目的に役立っているけど、生成されるデータ量が少なく、比較的コストがかかるんだ。それに対して、他のロングリードシーケンサーはもっとコスト効率が良いけど、複雑な管理と慎重な計画が必要なことが多い。さらに、大規模なシーケンシングデータの分析は、学生にとって複雑で難しいこともある。

ロングリードゲノミクスによる生物識別に焦点を当てる

このトレーニングは、学生にロングリードシーケンシングを使ってさまざまな植物を特定する方法を教えることを目指しているよ。生物識別は生態学における重要な研究分野で、科学者がさまざまな環境における種の多様性と数を研究するのを助けているんだ。これにより、DNAバーコーディングを使ってハーブ製品の真偽を確認するのにも重要な役割を果たしている。

このアプリケーションは、教育の場にぴったりだと思う。なぜなら、概念的にシンプルで、学生が他の研究で遭遇する共通のタスクに触れられるから。植物に焦点を当てることでトレーニングを充実させられるよ。植物の研究はラボ環境で見落とされがちだけど、エコシステムでは重要な役割を果たしているんだ。

スコットランドで集めた一般的な植物種を使って、学生たちは英国とアイルランドに存在するすべての種の参照ゲノムをシーケンスする大きなプロジェクトに自分の作業をつなげることができる。

種の識別原則を教える

学生に種の識別について教えるときは、プラスチドゲノムに焦点を当てるよ。プラスチドゲノムは小さくて組み立てやすく、DNAサンプルに多く存在するんだ。いくつかのデータベースが識別用のプラスチドデータを提供していて、そのサイズが小さいおかげで分析しやすいんだ。

私たちは「ロングリードゲノムスキム」法を選んだ。これはカバレッジが低いロングリードデータを生成する方法で、高カバレッジデータを生成するよりも予算に優しいけど、学生には似たような原則を教えられるんだ。プラスチドゲノムを組み立てるのは一般的に簡単だけど、特定の課題に取り組まなきゃいけないことはあるよ。

プラスチドゲノムは長い単一コピーの部分、組み立ての課題を引き起こすことができる2つの同一領域、そしてもう1つの小さい領域から構成されている。標準的な組み立て方法では、しばしば単一の完全なゲノムではなく、複数のセグメントを作成しがちなんだ。それに、プラスチドは細胞内に2種類の形で存在していて、分析プロセスを複雑にしている。だから、プラスチドゲノムの組み立てに特化したプログラムが開発されて、これらの課題に対処しているんだ。

若手研究者向けの実践的トレーニング

目標は、若手研究者のための応用ゲノミクスコースを作ることだよ。このコースは、ラボの経験が多少あるけど、まだゲノムシーケンシングやデータ分析をしたことがない1年目の博士課程の学生向けに設計されているんだ。

コースは2週間続き、ゲノミクスのワークフローに焦点を当てつつ、ラボスキルとバイオインフォマティクスのバランスを取るんだ。オックスフォードナノポアのシーケンシングは、ユーザーフレンドリーなプロトコル、ロングリードを生成する可能性、そして異なる機器に基づいて出力の柔軟性があるから選ばれたんだ。この技術は多くのプロジェクトにとって貴重で、学生たちが自分のラボでスキルを直接適用できるようにしているよ。

トレーニングの一環として、各学生にはそのアイデンティティを知らされずに植物サンプルが渡されて、それをクラスで学んだ方法で特定しなきゃならない。学生たちは、特定のツールやソフトウェアを使いながら、ラボの手順とバイオインフォマティクス分析のステップを経るんだ。

効果的なラボプロトコルの開発

成功する教育経験を確保するために、さまざまなラボプロトコルがテストされたんだ。目標は、ロングリードシーケンシングで使われる標準的な方法と比べてプロセスを効率化することだったよ。プロトコルは、乾燥した植物材料、異なる抽出キット、そしてDNAの質を向上させるための洗浄方法を使うことに焦点を当てていた。

一般的に栽培されているか野生の植物が、イギリスの大学キャンパスからサンプリングされ、ゲノムサイズと多様性に基づいて種を選ぶように注意を払ったんだ。葉のサンプルが収集され、DNA抽出のために準備された。

最初に、Qiagen DNeasy Plant Mini KitがDNA抽出テストに使われたけど、種によって収量に大きな差があったんだ。結果を改善するために、Nucleon PhytoPureキットも利用して、シーケンシングを妨げる可能性のある化合物を取り除くためのクリーンアップ手順も行った。この組み合わせは、一般的により良い抽出結果につながったよ。

シーケンシングのためのライブラリー準備はONTプロトコルを使って行い、DNAサンプルを分析のためにプールしたんだ。異なるシーケンサーでライブラリーをテストすることで、さまざまな方法のパフォーマンスを評価し、プロトコルの最終的な調整につながったんだ。

バイオインフォマティクストレーニングとプロトコル

バイオインフォマティクストレーニングは、学生に基本的なコンピュータースキルを教えることに焦点を当てていたよ。学生たちは、コマンドシェルを使ってデータを管理し、品質管理チェックを実行し、ゲノムの組み立てと分析を行う方法を学んだ。

バイオインフォマティクスの準備には、特定のソフトウェアをインストールし、システムのナビゲートと結果の分析方法を学生に理解させることが含まれていた。初めのステップでは、シーケンシングデータの質をチェックすることだった。次に、品質の高いリードだけを使って核ゲノムとプラスチドゲノムを組み立てるためにフィルタリング手法が適用されたんだ。

組み立てプロセスには、ロングリードデータ用に設計された特定のソフトウェアを使い、その結果を評価して組み立ての質と完全性を測定したよ。プラスチド分析のために、学生たちはプラスチドデータベースを参考にして、潜在的な種のアイデンティティを特定できるようになったんだ。

コースの提供と学生評価

このトレーニングプログラムは2つの学生グループに提供され、さまざまな専門知識のレベルが表現されたんだ。教え方にはラボとバイオインフォマティクスのセッションが含まれていて、学生はデータ分析に集中する前にハンズオン作業に関与できるようになっているよ。

各学生にはバイオインフォマティクス作業用の個別の仮想マシンが割り当てられ、ローカルハードウェアの制約を受けずに分析を行えるようになった。このセットアップにより、組み立て作業の処理が迅速に行えるようになったんだ。

授業の終わりには、学生たちに経験を評価するように求めた。フィードバックでは、コースと提供されたトレーニングへの高い満足度が示されたよ。多くの学生がラボ作業や学んだバイオインフォマティクスのプロセスを楽しんだと述べていたんだ。

信頼できるシーケンシングワークフローの開発

教室で開発されたロングリードシーケンシングのワークフローは、学生にゲノミクスについて教えるのに効果的であることが証明されたよ。利用可能なラボキットとバイオインフォマティクスツールを組み合わせることで、サンプルからシーケンス、分析までの完全な体験を作ることができたんだ。

植物を扱うことに関連する課題を慎重に考慮することで、アプローチが洗練された。小さなゲノムを持つ種を選び、プラスチドゲノムに焦点を当てることで、ゲノムデータの利用を改善できたんだ。

この方法は効果的だけど、サンプルごとに十分なシーケンシング出力を信頼できるようにすることはまだ課題なんだ。コストを管理可能に保つためにマルチプレキシングが必要になってきたけど、シーケンシング出力の変動が結果を予測するのを難しくしているよ。

将来的には、より良いシーケンシングカバレッジと質を確保するための条件を最適化することに焦点を当てるつもりだ。シーケンシング技術の改善も、追加のゲノム特性評価を可能にするような、より簡単なアプリケーションの機会を提供するかもしれないね。

植物識別におけるロングリードシーケンシングの重要性

このコースでは、植物識別の重要性を強調している特に低品質な材料を扱うことが多い研究にとっては重要なんだ。従来の方法は特定のDNA領域に依存しているけど、完全なプラスチドゲノムを使うことで、たくさんの利点があることが分かったんだ。

プラスチドゲノムの遺伝的キャラクターが多いことで、識別の精度が大きく向上する可能性があるよ。複雑な植物群では、プラスチドゲノムが標準的なDNAバーコーディング方法よりも効果的かもしれないけど、種の認識に関する課題は残っているんだ。

プラスチドゲノムの組み立ては、環境DNA研究や植物多様性の広範な分析など、多くのアプリケーションにとって特に有益だよ。データの質に関する懸念があっても、ロングリードシーケンシングは貴重な洞察を提供しているんだ。

このコースで示されたアプローチは、さまざまな文脈に適応できる可能性があるし、現在ゲノムデータが不足している未開拓の分類群の文書化を助けるかもしれないね。ロングリードシーケンシングの教育がさらに発展すれば、植物研究のさまざまな分野でより良い結果を得られるようになると思うよ。

オリジナルソース

タイトル: A workflow for practical training in ecological genomics using Oxford Nanopore long-read sequencing

概要: Long-read single molecule sequencing technologies continue to grow in popularity for genome assembly and provide an effective way to resolve large and complex genomic variants. However, uptake of these technologies for teaching and training is hampered by the complexity of high molecular weight DNA extraction protocols, the time required for library preparation and the costs for sequencing, as well as challenges with downstream data analyses. Here, we present a full long-read workflow optimised for teaching, that covers each stage from DNA extraction, to library preparation and sequencing, to data QC and genome assembly and characterisation, that can be completed in under two weeks. We use a specific case study of plant identification, where students identify an anonymous plant sample by sequencing and assembling the genome and comparing it to other samples and to reference databases. In testing, long-read genome skimming of nine wild-collected plant species extracted with a modified kit-based approach produced an average of 8Gb of Oxford Nanopore data, enabling the complete assembly of plastid genomes, and partial assembly of nuclear genomes. In the classroom, all students were able to complete the protocols, and to correctly identify their plant samples based on BOLD searches of barcoding loci extracted from the plastid genome, coupled with phylogenetic analyses of whole plastid genomes. We supply all the learning material and raw data allowing this to be adapted to a range of teaching settings.

著者: Alex D Twyford, R. Foster, H. De Weerd, N. C. Medd, T. Booth, C. Newman, H. Ritch, J. Santoyo-Lopez, U. Trivedi

最終更新: 2024-09-04 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.03.610948

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.03.610948.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事