マウスのゲノム研究の新しい進展
研究がマウスの遺伝学の理解を深め、ゲノムのギャップを埋めてるよ。
Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams
― 1 分で読む
目次
マウスは100年以上にわたって科学研究の重要な一部で、科学者たちが人間の病気について学んだり治療法を見つけたり、体の仕組みを理解するのを手助けしてきたんだ。マウスを使った重要な発見には、免疫系における特定の遺伝子の役割や、さまざまなタイプの細胞に変わることができる特別な幹細胞の創造が含まれているよ。
2002年には、科学者たちがC57BL/6J系統のマウスの初めての全ゲノムを完成させたんだ。ゲノムは生物内のDNAの完全なセットで、マウスのゲノムには19対の染色体とX染色体があって、Y染色体は独特の構造を持っているんだ。一部のマウスのゲノムの部分は染色体の構造のせいで研究が難しい。現在のマウスのゲノムは未完成で、約281のギャップがあるんだ。これらのギャップはすべての染色体に存在していて、テロメアやセントロメアといった重要な部分が未解決のままだよ。
テロメアとセントロメアの重要性
テロメアは染色体の保護端で、染色体が損傷しないように助けてくれる。セントロメアは細胞分裂の際に重要な役割を果たし、染色体を正しく分けるのに役立つ。現在のマウスゲノムは、これらの重要な染色体部分を正確に反映していないんだ。
最近のDNAシーケンシング技術の進歩により、より完全なマウスのゲノムを作成する方法が提供された。この研究では、科学者たちが非常に長いDNAの配列を読み取ることができる方法を使って、マウスの遺伝学のギャップを埋める機会を得たんだ。
T2Tマウスゲノムの作成
研究者たちはC57BL/6JとCAST/EiJの系統に対する初の完全なマウスゲノムを作ったよ。これらの完全なゲノム、T2T(テロメアからテロメアまで)と呼ばれるものには、完全なテロメアやセントロメアを含む、以前に欠けていた構造がすべて含まれている。新しいゲノムは古いバージョンよりも完成度が高く、マウスの遺伝学の理解を大きく広げたんだ。
DNAは2つのマウス系統の胚性幹細胞から取得された。科学者たちは長読みと短読みのシーケンシング方法の両方を使ってゲノムを組み立てた。彼らは6つの異なるゲノムアセンブリを作成し、それらを比較して、品質基準に基づいて最適なものを選んだよ。
ゲノムの欠けている部分を見つける
いくつかの染色体はまだ不完全で、端にテロメアの配列が不足していたんだ。それらの欠けている部分を見つけるために、研究者たちは未配置のDNA断片の中に特定の繰り返し配列を探した。また、もう一つの方法であるロングレンジHi-Cを使って、残りの配列を正しい染色体に割り当てる手助けもしたよ。
新しいゲノムと以前のバージョンを比較すると、新しいバージョンの方が長い配列を持っていることが明らかになった。例えば、C57BL/6J T2Tゲノムは以前のバージョンと比べて208メガベース(Mbp)の配列が追加されたんだ。
構造の精度
新しいゲノムアセンブリの正確さを確認するために、研究者たちは染色体の構造を調べた。T2Tゲノムは古いゲノムと比較して、構造的変異(SV)が少ないことがわかったよ。新しいバージョンでは挿入、欠失、重複、逆位が少なく観察され、より安定した構造を示しているんだ。
染色体構造の理解
新しいゲノムにより、染色体の構造を比較することができた。新しいゲノムはすべての染色体に完全なテロメアとセントロメアの表現が含まれていることが分かった。前のアセンブリにあったギャップは新しいデータで埋められ、2つの系統の間に大規模な違いが明らかになったんだ。
研究者たちは、古いゲノムではテロメアとセントロメアが適切に表現されていなかったことを発見し、新しいアセンブリがこの表現を大幅に改善したと。新しいゲノムは、染色体の構造と機能に重要なサテライト配列の増加を示したよ。
遺伝子アノテーションと新しい遺伝子
遺伝子アノテーションは、さまざまな組織タイプからのRNAシーケンシングを使用して行われた。新しいゲノムで見つかったタンパク質コーディング遺伝子の数は、以前の参照ゲノムと比較して同程度だった。しかし、研究者たちは新たに見つけた遺伝子も特定したよ。
この研究では、両系統にいくつかの新しい遺伝子が見つかった。これらの新しい遺伝子はサイズが異なり、たくさんの異なるエクソンを含んでいて、エクソンはタンパク質をコードする遺伝子の部分なんだ。中には既知のタンパク質に似たものもあって、これが彼らの潜在的な機能を示唆しているんだ。
コピー数が増えた遺伝子
研究者たちは、T2Tゲノムにおいて以前のバージョンと比較してコピー数が増えた遺伝子を多数発見した。これは、新しいゲノムにおいていくつかの遺伝子がより多く存在していたことを意味する。これらの遺伝子は、免疫系に関連するものなどさまざまなカテゴリに分類されていたよ。特定の遺伝子のコピー数にも、2つの系統間で違いがあることが確認された。
テロメアとセントロメアの構造
テロメアとセントロメアは染色体の安定性において重要な役割を果たしている。新しいゲノムでは、これらの領域の表現が大幅に改善された。C57BL/6JとCAST/EiJのT2Tゲノムは、以前の参照ゲノムよりもはるかに長いテロメアを持っていることが分かったよ。
研究者たちは、マウスのテロメアの長さが一般的に人間よりも長いことを発見した。この研究は、テロメアとセントロメアのサイズと構造を詳細に示し、2つのマウス系統の違いを強調しているんだ。
マウスのセントロメアは特定のタイプのサテライトDNAから成り立っていて、以前の研究ではあまり詳しく特徴づけられていなかった。新しいゲノムにより、セントロメアの領域の構造的複雑さがより明確に理解できるようになったよ。
テロセントリック染色体の端の比較
マウスの染色体は、セントロメアが染色体の端に位置する、テロセントリックと呼ばれる構造を持っている。研究者たちは両系統のテロセントリック構造を比較し、繰り返し配列の配置に違いがあることが分かったんだ。
C57BL/6J系統は特異な繰り返しの配置を示し、CAST/EiJはより変動のある配置を持っていた。これは、2つの系統の間の染色体構造の多様性を強調しているんだ。
マウス参照ゲノムの完成
以前の試みにもかかわらず、マウスのゲノム参照は未完成のままだ。T2T C57BL/6Jアセンブリは多くのギャップを埋めることに成功し、マウスゲノムにかなりの量の配列を追加した。この作業では、以前に欠けていた領域に301のタンパク質コーディング遺伝子が存在することが明らかになったよ。
研究者たちは、免疫応答に関連する領域などの特定の関心領域を強調し、今後の機能に関する研究を可能にした。このギャップ埋めの包括的アプローチは、マウスゲノムの全体的な品質を大幅に向上させたんだ。
擬似常染色体領域
この研究は、X染色体とY染色体の間で共有される擬似常染色体領域(PAR)にも焦点を当てた。新しいアセンブリはPARの理解を改善し、多くの新しい遺伝子や構造的特徴を明らかにしたよ。
2つのマウス系統間でPARを比較することで、遺伝子の内容や構造に違いがあることがわかり、ゲノムの小さな領域でも重要な変異が見られることが確認されたんだ。
マウスゲノムの逆位
逆位はゲノム内の再配置で、遺伝子の機能や調節に影響を与えることがある。この研究では、2つのマウス系統間で多数の逆位が特定され、その起源やこれらの構造的変化をもたらす繰り返し配列の役割に光が当たった。
研究者たちは、多くの逆位が大きな繰り返しセグメントに関連していることを見つけて、これらのセグメントがゲノムの進化や機能において役割を果たす可能性があることを示唆したよ。
KRAB亜鉛フィンガー蛋白質
KRAB亜鉛フィンガー蛋白質(KZFP)は遺伝子発現の調節に重要だ。新しいアセンブリでは、これらの蛋白質のカバレッジが大幅に改善され、ゲノムにおける役割の理解が進むことが可能になった。KZFPファミリーの数や配置の違いが2つの系統間で見られ、これらの領域が進化の影響を受けやすいことを示しているんだ。
結論
この研究はマウス遺伝学における大きな進展を示している。2つの重要な系統に対してより完全なゲノムを作成することで、研究者たちは遺伝学と病気に関する新たな調査の扉を開いたんだ。これらの改善されたゲノムは、以前に欠けていた領域のより明確な理解を提供し、これらの領域がどのように機能し、進化するのかの理解を深めているよ。
この作業は、遺伝的変異やそれらの健康や病気への影響を探る将来の研究の基盤を提供している。研究者たちがこの作業を基にさらなる進展を重ねることで、遺伝学の複雑さに対する洞察が深まり、生物学的プロセスの理解や病気の治療法開発に役立つことになるんだ。
タイトル: The structural diversity of telomeres and centromeres across mouse subspecies revealed by complete assemblies
概要: It is over twenty years since the publication of the C57BL/6J mouse reference genome, which has been a key catalyst for understanding mammalian disease biology. However, the mouse reference genome still lacks telomeres and centromeres, contains 281 chromosomal sequence gaps, and only partially represents many biomedically relevant loci. We present the first T2T mouse genomes for two key inbred strains, C57BL/6J and CAST/EiJ. These T2T genomes reveal significant variability in telomere and centromere sizes and structural organisation. We add an additional 213 Mbp of novel sequence to the reference genome containing 517 protein-coding genes. We examined two important but incomplete loci in the mouse genome - the pseudoautosomal region (PAR) on the sex chromosomes and KRAB zinc finger proteins (KZFPs) loci. We identified distant locations of the PAR boundary, different copy number and sizes of segmental duplications, and a multitude of amino acid substitution mutations in PAR genes.
著者: Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams
最終更新: 2024-10-26 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.10.24.619615
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.10.24.619615.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。