ゲノムシャッフルシーケンシングで遺伝子のバリエーション研究が進化中
Genome-Shuffle-seqは、構造変異とそれが遺伝に与える影響について新しい視点を提供するよ。
― 1 分で読む
目次
人間の遺伝的変異って、個々のDNAの違いを指すんだ。この変異は、特性や病気のリスク、環境要因に対する体の反応に影響を与えることがあるんだよ。主な遺伝的変異のタイプには、一塩基変異(SNV)、挿入や欠失(インデル)、単純配列反復、構造的変異(SV)が含まれる。構造的変異は、ゲノムの大きな変化、例えば欠失、重複、反転、染色体セグメントの転座を含むことがある。
SVの研究の課題
SVの研究は、SNVやインデルを調べるよりも難しいんだ。この課題は、生きている人間を対象とした研究でも、モデル生物を使った実験室での研究でも存在する。理由の一つは、新しく発生するSVは新しく発生するSNVに比べて少なくて、世代ごとに100倍以上もまれなんだ。つまり、SVは世代の中で繰り返し現れる可能性が低くて、特定の遺伝子や機能と結びつけるのが難しいんだ。その点、1つの遺伝子に影響を与えるSNVやインデルは、研究者が遺伝性の病気の明確な原因を特定できることが多いんだ。
さらに、SVはSNVやインデルよりも多くのDNA配列を破壊しやすいから、フィットネスに対する有害な影響の可能性が高まる。だから、一般的な頻度で見つかるSVは少なくて、大規模な研究、例えば全ゲノム関連研究(GWAS)を使ってその影響を研究するのが難しくなってる。大きなサンプルサイズがある程度助けにはなるけど、SVに関する限界を完全には解決できないんだ。
SNVとインデルの研究戦略
研究者たちは、SNVやインデルをモデル生物に導入して詳細に分析するためのさまざまな方法を開発してきたよ。これには、古典的な突然変異導入技術や、最近のベースエディティングみたいなアプローチが含まれる。他の戦略として、突然変異を引き起こすPCRを使って特定のDNA配列に広範囲の変異を作り出す方法がある。これにより、元の遺伝的コンテキストの中や外で研究できる。
特定のSNVやインデルが人間には現れなくても、モデルシステムで分析することで有益な洞察を得ることができる。例えば、特定の特性や病気に関与している遺伝子を特定したり、異なる遺伝的変異が調節やコーディング配列にどう影響するかを特徴付けたり、既知の病気関連遺伝子変異の潜在的な影響を予測することができる。ただ、SVはまだ制限があって、モデルシステムでそれを生成・分析する方法がSNVやインデルほど進んでいないんだ。
SVに関する未解決の疑問
SVの研究が難しいせいで、人間のゲノムにおけるその構造と機能についての多くの疑問が未解決のままなんだ。遺伝子や調節要素は、特定の配置でゲノム全体に分布している。これらの配置の意味を理解するのは重要だけど、研究者たちはその機能的結果をまだ十分には把握できていないんだ。
例えば、人間のゲノムのかなりの部分は遺伝子がほとんど存在しない「遺伝子砂漠」でできている。これらの領域内のいくつかの配列が役割を持っているかもしれないけど、これらの領域の大部分を削除しても特定の動物に目立った影響がないことがある。他のSVは遺伝性の障害を引き起こしたり病気リスクに寄与することが知られてるけど、ケースバイケースでそれがどう作用するのかはよくわからない。また、構造的変異はゲノムサイズに大きな違いをもたらすことがあって、比較をするのが難しくなる。
癌における体細胞SVの役割
生殖細胞SVに加えて、体細胞SV(生殖細胞以外の細胞で発生するもの)は癌の発生において重要な役割を果たしていることが知られている。体細胞SVのいくつかの形式、例えばクロモトリプシスやecDNAは、ほぼすべての人間の癌の発生や進行の重要な要因として認識されている。
ラボでのSVの工学
SVを工学するためのさまざまな方法が開発されてきた。例えば、特定の認識部位を正確な位置に配置することで、研究者は再結合を通じて特定のSVを作成できる。この方法は手間がかかることが多く、一度に少数のSVを研究することが通常だ。
別の方法では、CRISPR/Cas9技術を使って、同時に複数の二本鎖切断を作ることができ、全ゲノムにわたってSVを生成できる。ただ、このアプローチには低効率や潜在的な毒性といった課題があって、どの細胞が誘導されたSVを含んでいるのか特定するのが難しい。
研究者たちは、一つの大きな努力として、Genome-Shuffle-seqという手法を作り出した。これにより、哺乳類のゲノムにおける何千ものSVの生成やマッピングが簡単になる。この手法の重要な特徴の一つは、細胞の集団内でSVのブレークポイントの位置を高精度でマッピングできることだ。
Genome-Shuffle-seqの仕組み
Genome-Shuffle-seqの方法は、シャッフルカセットと呼ばれる特別なDNA配列を哺乳類細胞のゲノムに統合することを含む。各シャッフルカセットには、ゲノム内の位置や、これらのカセットの間の再結合を通じて形成されるSVを追跡するための機能がある。
カセットがゲノムに挿入されたら、研究者は再結合酵素を使ってシャッフルカセット間の再結合イベントを促進することでSVを誘導できる。シーケンシング法を使用することで、これらの再結合イベントから生じる新しいDNA配列の組み合わせを特定し、定量化できる。
概念の証明
Genome-Shuffle-seqの効果を示すために、研究者たちは特定のマウス胚性幹細胞株にシャッフルカセットのライブラリを導入した。ほとんどのシャッフルカセットがさまざまな染色体に均等に分布していることが見つかり、精密なマッピングと特定を可能にした。再結合を使ってSVが誘導された後、研究者たちはSVの存在を示す何千もの新しいDNA組み合わせを検出し、この手法の効率を示した。
Genome-Shuffle-seqの利点
Genome-Shuffle-seqを使うことで、研究者たちは個々のクローンを隔離したり、広範囲のシーケンシングを行うことなくSVを生成して分析できることを示した。この手法は、細胞集団内のSVの位置や種類をマッピングする直接的で効率的な方法を提供する。
さらに、研究者たちはSVのアイデンティティを、個別の細胞の転写情報と共にキャプチャできる。この二重アプローチにより、特定のSVが遺伝子発現やその他の細胞機能にどのように影響するかを研究できる。
SV誘導後の細胞動態の観察
SVを誘導した後、研究者たちは時間の経過とともにこれらの細胞の動態を監視した。時間が進むにつれて検出されたSVの数が大幅に減少したことがわかった。これは再結合酵素に関連する毒性が原因だと考えられている。この観察は、SVの介入が細胞のフィットネスに与える影響を考慮する重要性を強調している。
単一細胞のジェノタイピング
Genome-Shuffle-seqは、単一細胞のトランスクリプトミクスと互換性があるように設計されている。研究者たちは特定のマーカーに基づいて細胞をソートし、それからその転写情報と対応するSVを分析できる。このアプローチにより、研究者たちは個々の細胞内でSVを確認し、マッピングして、遺伝的変化と細胞の振る舞いとの関係を探ることができる。
ecDNAの検出
興味深いことに、研究はSV形成中に生成されるecDNAが、対応するゲノム欠失よりも高い量で見つかることが多いことを明らかにした。この発見は、ecDNAの振る舞い、特にそれらがネイティブな染色体とは異なる速度で複製されるかどうかに関する疑問を生じさせる。
Genome-Shuffle-seqの制限
可能性がある一方で、Genome-Shuffle-seqには制限もある。例えば、使用されるシャッフルカセットの性質のために、いくつかのタイプのSVは検出できないかもしれない。カセットのデザインやシーケンシング方法の改善が、SVの全体的な検出率を向上させるかもしれない。
もう一つの課題は、誘導から数週間以内にSVが急速に減少することで、これらの変異に関連する遺伝子発現や細胞効果の研究が複雑になることだ。今後の実験では、再結合の毒性を減らしたり、SVを研究する遺伝的システムを最適化したりすることに焦点を当てる必要があるかもしれない。
Genome-Shuffle-seqの可能性
これらの課題にもかかわらず、Genome-Shuffle-seqはSVやecDNAが遺伝子発現、ゲノムの構造、クロマチン構造に与える影響を研究する新たな機会を開いている。この手法は、構造的遺伝的変異がさまざまな細胞プロセスにどのように影響を与えるかを理解し、SVに関連する病気の治療のための潜在的なターゲットを特定するのに役立つんだ。
結論として、Genome-Shuffle-seqは遺伝的変異の研究に利用できるツールの中で大きな進展を示している。この手法により、SVの効率的な生成と広範囲なマッピングが可能になり、遺伝子病の基礎的なメカニズムやSVの進化や発生における役割を明らかにするための基盤が整ったんだ。この革新的なアプローチは、基礎的な生物学研究や医学の実用的な応用に貢献する可能性がある。
タイトル: Multiplex generation and single cell analysis of structural variants in a mammalian genome
概要: The functional consequences of structural variants (SVs) in mammalian genomes are challenging to study. This is due to several factors, including: 1) their numerical paucity relative to other forms of standing genetic variation such as single nucleotide variants (SNVs) and short insertions or deletions (indels); 2) the fact that a single SV can involve and potentially impact the function of more than one gene and/or cis regulatory element; and 3) the relative immaturity of methods to generate and map SVs, either randomly or in targeted fashion, in in vitro or in vivo model systems. Towards addressing these challenges, we developed Genome-Shuffle-seq, a straightforward method that enables the multiplex generation and mapping of several major forms of SVs (deletions, inversions, translocations) throughout a mammalian genome. Genome-Shuffle-seq is based on the integration of "shuffle cassettes to the genome, wherein each shuffle cassette contains components that facilitate its site-specific recombination (SSR) with other integrated shuffle cassettes (via Cre-loxP), its mapping to a specific genomic location (via T7-mediated in vitro transcription or IVT), and its identification in single-cell RNA-seq (scRNA-seq) data (via T7-mediated in situ transcription or IST). In this proof-of-concept, we apply Genome-Shuffle-seq to induce and map thousands of genomic SVs in mouse embryonic stem cells (mESCs) in a single experiment. Induced SVs are rapidly depleted from the cellular population over time, possibly due to Cre-mediated toxicity and/or negative selection on the rearrangements themselves. Leveraging T7 IST of barcodes whose positions are already mapped, we further demonstrate that we can efficiently genotype which SVs are present in association with each of many single cell transcriptomes in scRNA-seq data. Finally, preliminary evidence suggests our method may be a powerful means of generating extrachromosomal circular DNAs (ecDNAs). Looking forward, we anticipate that Genome-Shuffle-seq may be broadly useful for the systematic exploration of the functional consequences of SVs on gene expression, the chromatin landscape, and 3D nuclear architecture. We further anticipate potential uses for in vitro modeling of ecDNAs, as well as in paving the path to a minimal mammalian genome.
著者: Jay Shendure, S. Pinglay, J.-B. Lalanne, R. M. Daza, J. Koeppel, X. Li, D. S. Lee
最終更新: 2024-02-12 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.01.22.576756
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.01.22.576756.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。