遺伝物質の未来:XNAs
XNAsは遺伝子研究やバイオテクノロジーで新しい可能性を提供する。
Mauricio Lisboa Perez, Michiko Kimoto, Priscilla Rajakumar, Chayaporn Suphavilai, Rafael Peres da Silva, Hui Pen Tan, Nicholas Ting Xun Ong, Hannah Nicholas, Ichiro Hirao, Chew Wei Leong, Niranjan Nagarajan
― 1 分で読む
目次
合成外来核酸、略してXNAは、人間のDNAやRNAにある通常の構成要素を超えた新しいタイプの遺伝物質だよ。私たちのDNAが4つの主要な塩基(A、T、C、G)でできているのに対して、XNAには自然界にはない不自然な塩基が含まれている。この拡張は、新しい生命の形を作り出したり、最先端技術を開発するためのエキサイティングな機会を提供してるんだ。
子供たちがただかくれんぼや鬼ごっこをするのではなく、いろんな新しい遊びを考えられる遊び場を想像してみて。XNAはそんな新しい遊びのようなもので、科学者たちが従来の生物学のルールから外れて考えることを可能にするんだ。
不自然な塩基の不思議
XNAの不自然な塩基は、通常のDNA塩基とは違う振る舞いをする。このユニークな特性のおかげで、科学者たちは合成生物学やバイオテクノロジーなどのさまざまな分野で新しいツールや方法を作り出せるんだ。たとえば、研究者たちはPやZという名前の塩基を持つXNAを作り、他にもd5SICSやdNaMといったものもある。彼らはこれらの新しい塩基を使って、小さな機械やセンサー、さらには将来的に医療や環境科学の大きな問題解決に役立つかもしれない合成生物を作る研究をしているんだ。
従来のDNAを信頼できる昔ながらの車に例えるなら、XNAはクールな電動スクーターのようなもので、違っていて速くて、車では行けない場所にも行けるんだ。
合成XNAの配列決定:新たな挑戦
XNAを研究して理解するために、研究者たちはそれらを配列決定する必要がある。これは図書館司書が本をカタログ化するのと似ている。でも、XNAの配列決定は、現在の方法が従来のDNA用に設計されているため、いくつかの課題があるんだ。一般的なアプローチはサンガーシーケンシングのような方法を使うことで、不自然な塩基の位置を特定できない場合が多い。
別の方法では、配列決定する前に不自然な塩基を従来のものに置き換えようとするけど、そうするとエラーが発生することがある。まるでジグソーパズルを組み立てようとして、別のセットのピースが混ざっていることに気づくようなものだね。イライラする!
次世代シーケンシング:未来がここに
科学者たちは、次世代シーケンシングに興奮している。なぜなら、古い方法よりもずっと速いから。でも、それでも不自然な塩基の検出には苦労しているんだ。最近の技術を使って、複雑な作業なしでXNAを直接シーケンスできるかもしれないという興味がある。これらの進展は、フィリップフォンからスマートフォンに移行するようなもので、もっと多くの機能があるんだ!
ナノポアシーケンシングプラットフォームでのブレークスルー
最近の進展で、研究者たちはナノポアシーケンシングプラットフォームを使ってXNAを直接シーケンスすることに成功した。このデバイスは水フィルターのように働き、異なる材料が通過して分析される。結果は、初期の方法でも2百万回以上のリードを得ることができ、特に問題はなく、XNAが既存のシーケンシング技術にうまくフィットすることが明らかになった。
まるで四角い杭を丸い穴に入れる新しい方法を見つけたようなもので、結局はうまくいくことがわかったんだ!
XNAのライブラリを作成する
さらに探求するために、研究者たちはXNAテンプレートのライブラリを設計した。これは遺伝子配列の宝箱のようで、テスト用のものだった。異なる不自然な塩基と従来の塩基の組み合わせを使って、多様なXNAコレクションを作り出した。
賢いアプローチを使えば、最大1,024の異なる組み合わせを持つテンプレートを生成できた。このライブラリはハイスループットシーケンシングを可能にし、XNAに特化したシーケンシング技術の開発を促進したんだ。
シーケンシングからの信号分析
研究者たちがこれらのXNAをシーケンスしたとき、ナノポアシーケンサーによって生成された電気信号がユニークで、特に不自然な塩基の周辺で異なっていることに気づいた。信号パターンは、不自然な塩基の位置についての手がかりを提供し、まるで遺伝情報の森を進むためのパンくずのようだった。
重要なのは、これらの不自然な塩基の近くで取られた読み取りが制御DNAとは強い違いを示し、信号の振る舞いが異なっていたことだ。この違いにより、科学者たちは不自然な塩基がどこにあるかだけでなく、それらが他の遺伝物質とどのように相互作用するかも特定できるようになったんだ。
ベースコーラーモデルの構築
配列決定中に生成される信号を解釈するためには、ベースコーラーモデルを作ることが重要なんだ。このモデルは、電気信号を認識可能な遺伝子コードに変換する翻訳者の役割を果たす。研究チームは、自然と不自然な塩基の両方を扱うように設計された専門的な深層学習モデルを開発した。
これはまるで犬に「座れ」と「待て」の命令を理解させるようなもので、多様な例で数回のトレーニングの後、モデルは80%以上の精度を超える成功率を達成したんだ。
データ増強:パフォーマンスの向上
研究者たちは、モデルの一般的な能力を向上させるために、トレーニングデータを拡大する必要があることに気づいた。データ増強技術を使って、様々な配列コンテキストを反映したシミュレートされた配列を生成できた。
このアプローチにより、モデルのパフォーマンスを向上させるための人工的な読み取りを生成することができた。これは、レシピに新しい材料を加えることで料理全体が変わるのと同じように、データ入力を変えることでモデルをさらに洗練する助けになったんだ。
モデルのテストと結果
トレーニングの後、モデルは証明コンセプトライブラリとより複雑なXNAコレクションで徹底的にテストされた。結果は、不自然な塩基とその近くの自然な塩基を特定するための高い精度を示した。
モデルは一般的に良好に機能したが、不自然な塩基の近くでのベースコーリング精度に関連する一般的な障害にも直面した。でも、全体的なパフォーマンスが大幅に低下することなく、困難なデータを処理する驚異的な能力を示したんだ。
結論と今後の方向性
XNAの直接シーケンシングの成功は、遺伝子研究における大きな一歩を意味している。ナノポア技術の力を借りて、研究者たちは将来的な合成生物学プロジェクトに組み込むことができる他の不自然な塩基を探求することを楽しみにしている。
この探求は、新しい医薬品の開発や環境問題に対処できる生物の創出など、さまざまな分野でのブレークスルーにつながる可能性がある。車輪の発明が旅行の流れを変えたように、XNAのシーケンシングは生物科学の方向性を変える可能性があるんだ。
最後に、科学者たちがXNAの可能性を押し広げ続ける限り、未来は明るい。人類や環境に利益をもたらす革新的な解決策を見つけ続けることが目標で、楽しむことを忘れないようにしよう-だって、ちょっとしたワクワクがなければ科学なんてつまらないからね!
タイトル: Direct high-throughput deconvolution of unnatural bases via nanopore sequencing and bootstrapped learning
概要: The discovery of synthetic xeno-nucleic acids (XNAs) that can basepair as unnatural bases (UBs) to expand the genetic alphabet has spawned interest in many applications, from synthetic biology to DNA storage. However, the inability to read XNAs in a direct, high-throughput manner has been a significant limitation for xenobiology. Here we demonstrate that XNA-containing templates can be directly and robustly sequenced (>2.3 million reads/flowcell, similar to DNA controls) on a MinION sequencer from Oxford Nanopore Technologies to obtain signal data that is significantly distinct from DNA controls (median fold-change >6x). To enable training of machine learning models that deconvolve these signals and basecall XNAs along with natural bases, we developed a framework to synthesize a complex pool of 1,024 UB-containing oligonucleotides with diverse 6-mer sequence contexts and high XNA purity (>90% UB-insertion on average). Bootstrapped models to enable data preparation, and data augmentation with spliced XNA reads to provide high context diversity, enabled learning of a generalizable model to call natural as well as unnatural bases with high accuracy (>80%) and specificity (99%). These results highlight the versatility of nanopore sequencing as a platform for interrogating nucleic acids for xenobiology applications, and the potential to transform the study of genetic material beyond those that use canonical bases.
著者: Mauricio Lisboa Perez, Michiko Kimoto, Priscilla Rajakumar, Chayaporn Suphavilai, Rafael Peres da Silva, Hui Pen Tan, Nicholas Ting Xun Ong, Hannah Nicholas, Ichiro Hirao, Chew Wei Leong, Niranjan Nagarajan
最終更新: 2024-12-02 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.12.02.625113
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.12.02.625113.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。