Simple Science

最先端の科学をわかりやすく解説

# 生物学# ゲノミクス

ロングリードシーケンシングの進展:ヒトゲノムを新たな視点で見る

最近の技術で人間のDNAや遺伝子調節の理解が進んでる。

― 1 分で読む


ゲノム理解の革命ゲノム理解の革命さが明らかになった。新しい方法で遺伝子調節やDNA構造の複雑
目次

最近、ロングリードシーケンシングっていう方法の改善があって、科学者たちは人間のゲノムをもっと正確に組み立てられるようになったんだ。この技術のおかげで、研究者たちは人間のDNAの違いを調べて、遺伝子がどう働くかを知る手助けをしてる。今の目標は、特に人間のゲノムの全体地図ができたから、これらの遺伝子が何をしてるのかを理解すること。でも、DNAの働きを試す方法の多くは、まだ古い方法に頼っていて、全体像を捉えきれてないんだ。

クロマチンアッセイとその課題

クロマチンを調べる多くのテストは、DNAをパッケージする細胞の構造を、簡略化された人間ゲノムのバージョンに依存してる。この簡略化されたバージョンには、個人間に存在するDNAのすべてのバリエーションが含まれてないんだ。ショートリード法は、クロマチンを正確に分析するのが難しいから、重要な詳細を見逃すことがある。個人ごとに異なるDNAの要素をマッピングしようとすると、これらの方法はエラーを生むことがあって、要素がどう働くかを理解するのが複雑になっちゃう。

ロングリード技術の可能性

Fiber-seqみたいなロングリード法は、DNA要素をより良くマッピングできる。Fiber-seqは特別な酵素を使って、特定のタンパク質がDNAにどこに付くかをマークするんだ。このマークによって、ショートリード法じゃ見えない方法でDNAがどんなふうに構造化されているかや、調整されているかを研究者たちは見ることができる。Fiber-seqを使えば、科学者たちはDNAの配列だけじゃなく、遺伝子の活動を調整するタンパク質に対して、特定の領域がどれだけアクセスしやすいかも測れるんだ。

分析用の新しいツールの開発

ロングリード法からのデータをよりよく理解するために、研究者たちは新しい機械学習ツールを開発した。このツールは、個々のDNAリード内のパターンを分類して、遺伝子調整に関与する可能性のあるDNAの領域を特定する手助けをしてくれる。このツールを使うことで、研究者たちは遺伝子がどう機能するか、X染色体の遺伝子がどう管理されるか、人間のDNAがどう進化してきたかに関する重要な原則を明らかにできるんだ。

Fiber-seqでの調整要素の特定

Fiber-seqは、研究者たちにタンパク質がDNAにどこに付くかを非常に詳細に見ることを可能にする。これらの付着点をマークすることで、科学者たちはおそらく調整要素であるDNAの領域を特定できる。ただ、そのサイズを見るだけでは、実際に調整に関与しているかどうかを判断するには不十分なんだ。研究者たちは、マークの密度みたいな他の特性も重要な情報を明らかにできるかもしれないと考えた。

調整要素の分類

これらの調整要素を分類するために、科学者たちは大量のFiber-seqデータを生成した。このデータを使って機械学習モデルをトレーニングして、重要な調整要素と重要でないDNAの領域を区別できるようにした。トレーニングが終わると、モデルは数百万のDNAセグメントを分類できるようになり、クロマチンの構造についての理解が大幅に進んだんだ。

発見の集約と分析

潜在的な調整要素を特定した後、次のステップは、ゲノム全体でこれらの発見を分析することだった。研究者たちは、クロマチンのアクセス可能性を評価するためのスコアリングシステムを作って、DNAの領域がタンパク質の結合に対してどれだけオープンまたはクローズドかを視覚化する手助けをしてる。このスコアを既存のデータベースと比べて、どれだけ自分たちの発見が現知識と合ってるかを見たんだ。

既存の方法との比較

新しいアプローチを検証するために、研究者たちは自分たちの結果をscATAC-seqみたいな確立された方法と比較した。全体的に見て、Fiber-seqによって特定された多くの領域は、これらの古い方法で特定されたものとよく合致してた。ただ、Fiber-seqは古い方法では見逃されがちな小さな調整要素を特定するのに特に効果的だったんだ。

ショートリード法の課題

ショートリード法は、特に小さなDNAの領域でクロマチンのアクセス可能性を正確に評価するのが難しいことがある。分析中に生じるバイアスなどの問題は、アクセス可能性の大幅な過小評価を引き起こす可能性がある。例えば、リピートするようなDNAの特定のタイプや小さなDNAはまったく検出されないことがあるため、遺伝子がどう調整されるかの理解にギャップが生まれちゃうんだ。

ハプロタイプ解決:一歩前進

DNAを母方と父方のハプロタイプに分けることで、研究者たちは遺伝子調整やDNAのバリエーションがアクセス可能性に与える影響をよりよく理解できるようになるんだ。これは、免疫機能に関連するようなゲノムの複雑な領域を理解するのに特に重要なんだ。この知識を使って、科学者たちは異なる遺伝子のバリアントがクロマチンの構造や調整にどう影響するかを明らかにできる。

遺伝子調整とクロマチンアクセス可能性に関する発見

研究者たちは、2つのハプロタイプ間の異なるアクセス可能性パターンの多数の事例を特定して、遺伝子がその遺伝的背景によってどう調整されるかに関する洞察を提供した。特定の領域は、一方のハプロタイプに比べて他方の方がアクセスしやすいことが分かって、それらの違いが遺伝子の発現において重要な役割を果たす可能性があることを示唆してる。

クロマチンのアクセス可能性と病気の関連性

病気に関連があることが知られている領域では、研究者たちはクロマチンアクセス可能性において重要なバリエーションを見つけた。この発見は、DNA配列のバリエーションが遺伝子の機能に影響を与えるだけじゃなくて、特定の状態の発展にも寄与している可能性があることを示唆してる。Fiber-seqを使ってこれらの違いを定量化することで、遺伝的バリエーションが健康結果にどう影響するかをよりよく理解する機会が得られるんだ。

X染色体の不活性化とその複雑さ

X染色体を詳しく調べる中で、研究者たちは女性のX染色体の一つで不活性化がどう起こるかを分析した。驚いたことに、無効な染色体上の多くの領域がまだアクセス可能であることが分かった。これは、今まで思われていた通り、無効なXが完全に沈黙しているわけではなく、遺伝子発現にまだ影響を与える可能性のある調整要素を持っていることを示してるんだ。

未来の研究への影響

ロングリードシーケンシングの進歩と新しい分析ツールの開発は、人間の遺伝学へのさらなる研究の道を開いている。この技術によって、科学者たちは遺伝子がどう機能し、互いにどう作用し合っているのかをより微妙に捉えることができるようになる。これらの相互作用をよりよく理解できれば、遺伝性疾患に関する新しい洞察や、治療アプローチの可能性につながるかもしれない。

結論

まとめると、Fiber-seqのようなロングリードシーケンシング技術は、ゲノミクスの分野を変革している。研究者たちは人間のゲノムの複雑さを解き明かし始めていて、遺伝的バリエーション、遺伝子調整、病気の間の繊細な関係を明らかにしてる。この分野が進展することで、人間の健康や病気についてのより深い洞察を提供する可能性があり、医学研究や治療の新しい道を開くことになる。ここで行われた研究は、私たちの体が分子レベルでどう機能するかに関する基本的な問いに答えるための遺伝子研究の興奮する可能性を強調してるんだ。

オリジナルソース

タイトル: A haplotype-resolved view of human gene regulation

概要: Most human cells contain two non-identical genomes, and differences in their regulation underlie human development and disease. We demonstrate that Fiber-seq Inferred Regulatory Elements (FIREs) enable the accurate quantification of chromatin accessibility across the 6 Gbp diploid human genome with single-molecule and single-nucleotide precision. We find that cells can harbor >1,000 regulatory elements with haplotype-selective chromatin accessibility (HSCA) and show that these elements preferentially localize to genomic loci containing the most human genetic diversity, with the human leukocyte antigen (HLA) locus showing the largest amount of HSCA genome-wide in immune cells. Furthermore, we uncover HSCA elements with sequence non-deterministic chromatin accessibility, representing likely somatic epimutations, and show that productive transcription from the inactive X chromosome is buttressed by clustered promoter-proximal elements that escape X chromosome inactivation.

著者: Andrew B. Stergachis, M. R. Vollger, E. G. Swanson, S. J. Neph, J. Ranchalis, K. M. Munson, C.-H. Ho, A. E. Sedeno-Cortes, W. E. Fondrie, S. C. Bohaczuk, Y. Mao, N. L. Parmalee, B. J. Mallory, W. T. Harvey, Y. Kwon, G. H. Garcia, K. Hoekzema, J. G. Meyer, M. Cicek, E. E. Eichler, W. S. Noble, D. M. Witten, J. T. Bennett, J. P. Ray

最終更新: 2024-06-16 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.14.599122

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.14.599122.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事