作物改良のための遺伝子編集の進展
遺伝子編集で作物の強さ、資源の使い方、栄養がアップする。
― 1 分で読む
目次
遺伝子編集は作物の改善に大きな可能性を秘めてるよ。強くて、資源をもっと効率的に使えて、より良い栄養を提供できる植物を作るのに役立つんだ。でも、遺伝子編集を本当に活用するためには、DNAの特定の部分を変えるだけじゃダメなんだ。遺伝子がどのようにコントロールされてるのか、そして異なる状況でどのように表現されるのかを理解する必要があるんだ。
遺伝子制御の複雑さ
DNAにはタンパク質をコードする部分と、そうじゃない部分があるんだ。タンパク質コーディングの配列は特定しやすくて研究もしやすい。科学者たちは、これらのコーディング部分にどんな変化を加えるとタンパク質の働きに影響があるかを理解する進展を遂げてきたよ。でも、遺伝子コーディング配列がメッセンジャーRNAにどのように変換されるかをコントロールする非コーディング領域については、はるかに難しいんだ。これらの調整領域は重要な役割を果たすけど、理解するのはまだまだ挑戦的なんだ。
調整配列を特定するためのアプローチ
この非コーディングの調整部分を見つけるためには、少なくとも2つの主な戦略があるんだ。一つのアプローチは、異なる種の間で時間とともに変わらない非コーディング配列を探すこと。これを保存された非コーディング配列の特定って呼んでいて、遺伝子の機能にとって重要な領域を特定するのに役立つんだ。もう一つの方法は、遺伝子発現にアクセス可能なDNAの部分、つまりオープンクロマチン領域を調べることなんだ。
科学者たちは、関連する植物のDNAを比較して、これらの重要な領域を見つけてるよ。進化が遅い非コーディング部分は、近くの遺伝子を調整することが多い。でも、若い調整配列は保存されてるとは言えない。植物で重要と認識されている最小の部分は、タンパク質がDNAに結合する場所よりも大きいことが多いんだ。
オープンクロマチンの役割
オープンクロマチン領域は、さまざまなシーケンシング技術を使って研究されてきた。これらのエリアは通常、異なる植物の特性に関連する多くの遺伝的マーカーを含んでるんだ。でも、多くの現在の方法は、より大きなDNAのセグメントを特定するから、重要な調整配列以上のものを捉えちゃうかもしれない。
遺伝子発現予測における機械学習
最近数年で、機械学習のおかげでDNA配列に基づいて遺伝子発現を予測できるようになったんだ。これらのモデルは、近くのDNA配列に基づいて、2つの遺伝子のどっちがより活発になるかを決定できるんだ。例えば、科学者たちはこれらのアプローチをトウモロコシっていう重要な作物で使って、遺伝子がストレスや他の条件にどう反応するかを予測して成功を収めたよ。
でも、DNA配列だけに基づいて遺伝子発現の詳細なパターンを予測するのはもっと複雑だってわかってる。一部のモデルは部分的に成功してるけど、これらの予測の精度はばらつきがあるんだ。あるモデルは対照群よりも良い結果を示したけど、いろんな組織で異なる遺伝子がどれくらい表現されるかを正確に予測するのはまだ難しかったんだ。
トランスフォーマーモデルの構築
予測をもっと正確にするために、新しいモデルが作られて、個々のトウモロコシ遺伝子が異なる組織でどれだけ表現されるかを予測できるようになった。このモデルは、各遺伝子の周りのより広い範囲のDNAを使って、遺伝子の開始点と終了点から遠くまで伸びてるんだ。データセットを慎重に分割して重複を防ぐことで、研究者たちはモデルの効果を評価できたよ。
このモデルは、遺伝子発現データを見るときに、単純なテストを大幅に上回った。でも、小さなDNAのセグメントだけを調べたときには、予測があまりうまくいかなかったんだ。
DNA塩基の重要性の分析
遺伝子発現にとってどの特定のDNAの部分が重要かをよりよく理解するために、モデルは調整機能のマーカーに関連する個々のヌクレオチドの重要性を調べたんだ。これらのマーカーには保存された非コーディング配列やオープンクロマチンエリアが含まれてる。いくつかのトウモロコシ遺伝子からのデータは、多くの重要な非コーディング配列がヌクレオチドの重要性のスコアが高い部分に並んでいることを示したよ。
トウモロコシと別の関連植物、ソルガムの結果を比較したとき、似たようなパターンが現れたんだ。トウモロコシで訓練されたモデルはソルガムの組織表現レベルを予測できたから、いくつかの調整因子が両方の種で共有されてることを示してるね。
非コーディング領域の重要性
非コーディング領域は遺伝子がどのように表現されるかを定義するのに重要な役割を果たしてる。多くの研究はDNAの近くの部分に焦点を当ててきたけど、もっと遠くの非コーディング領域も重要だっていう証拠が増えてきてるんだ。より大きなDNAのセグメントを使うことで、研究者たちは調整配列と遺伝子発現の関係を特定できるかもしれない。
このアプローチは、遺伝子をより良く編集する方法を学ぶ助けになるかもしれないし、DNA全体の景観を考慮しながら行うことができるんだ。これらの調整要素を理解することで、異なる植物がなぜさまざまな特性を示すのかを説明できるようになるし、それは作物の改善や、変化する気候に対する抵抗力を高めるのに重要なんだ。
未来を見据えて
遺伝子編集と調整の研究は、技術と手法の進歩とともに進化し続けてる。研究者たちがより大きなDNAのセグメントを効果的に分析する方法を学び、機械学習を適用することで、作物の改善に大きな進展が期待できるよ。
コーディングDNAと非コーディングDNAの両方の知識を組み合わせることで、科学者たちは農業の実践を向上させるためのより良い戦略を開発できるんだ。この理解は、食料安全保障の課題に取り組み、変化する条件でも成長できる強靭な作物を育てるために重要になるよ。
結論
遺伝子編集は農業をより良く変える大きな可能性を秘めてる。だけど、その完全な能力を引き出すためには、遺伝子の調整の複雑な網を深く理解する必要があるんだ。遺伝子とその調整領域の両方に焦点を当てることで、科学者たちはより生産的で持続可能な作物を作る方向に進んでいけるよ。コーディング部分と非コーディング部分の間のギャップを埋める努力が、未来のより情報に基づいた効果的な農業の実践につながるだろうね。
タイトル: Models trained to predict differential expression across plant organs identify distal and proximal regulatory regions
概要: AO_SCPLOWBSTRACTC_SCPLOWA large proportion of standing phenotypic variation is explained by genetic variation in noncoding regulatory regions. However, tools for the automated identification and characterization of noncoding regulatory sequences in genomes have lagged far behind those employed to annotate and predict the functions of protein coding sequences. We developed a modified transformer model and trained it to predict relative patterns of expression across a diverse set of tissues given a large sequence window for each gene of interest in the maize (Zea mays) genome. Nucleotides in the input DNA sequence with high saliency in gene expression pattern prediction overlapped with regions identified via comparative genomic or chromatin-based approaches as potential regulatory sequences. High saliency regions identified in a second species, sorghum (Sorghum bicolor), without species-specific training were also associated with potential regulatory sequences in noncoding regions upstream and downstream of each gene of interest. The potential impact of a scaleable and transferable approach to identifying regulatory sequences using saliency calculated from large context window models spans multiple applications. Specific use cases could include genome annotation, interpretation of natural genetic variation, and targeted editing in noncoding regions to alter patterns of levels of gene expression.
著者: James C Schnable, M. C. Tross, G. Duggan, N. Shrestha
最終更新: 2024-06-06 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.04.597477
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.04.597477.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。