非コーディング変異を通じた自閉症スペクトラム障害への新たな洞察
研究は自閉症スペクトラム障害に関連するノンコーディング遺伝子変異を探る。
― 1 分で読む
目次
全ゲノムシーケンシング(WGS)は、個人のDNA内のすべての遺伝子を調べる方法だよ。最近、科学者たちはWGSを使って、特に遺伝子によって作られるタンパク質に影響を与えないような特定の珍しいDNAの変化が、人間の複雑な特性にどう関係しているかを研究し始めたんだ。興味深い複雑な特性のひとつが自閉症スペクトラム障害(ASD)で、これはコミュニケーションや行動に影響を与える発達障害だよ。
遺伝学研究とASDの背景
以前は、研究者たちは遺伝情報の小さなセット、たとえばアレイやエクソームシーケンシングを使って、ASDに関連する一般的またはまれな遺伝子変化との関連を見つけてた。でも、これらの方法では、DNAのコーディングされていない領域の珍しい変化がASDにどう影響するかを深く調査することができなかったんだ。
研究者たちが注目した重要なデータのグループは、シモンズ・シンプルックス・コレクション(SSC)からのデータだよ。このデータセットには、ASDの子どもが少なくとも一人いる多くの家族のWGS情報が含まれている。研究者たちは特に「de novo」変異、つまり子どもに新しく現れた遺伝子の変化で親から受け継がれていないものを見てみたいと思ってる。この変異は、自然選択の影響を受けにくいため、研究者たちが影響を与える可能性のある変化に焦点を当てるのに役立つんだ。
コーディングされていない変異の分析の課題
この貴重なデータにアクセスできるにも関わらず、コーディングされていない変異とASDとの関連を分析するのは課題が多いよ。SSCデータに関する初期の研究では、これらの変異とASDとの関連を見つけるために多くの方法が試されたけど、複数のテストを補正した後では強い関連は見つからなかった。でも、ある分析ではリスクスコア法を使って、変異と遺伝子の活動を調節するDNAの領域との関連を見つけたんだ。
研究者たちは、de novoコーディングされていない変異がASDに与える影響をよりよく理解するために、クロマチンのアクセシビリティや遺伝子活動を制御するタンパク質の結合などの特徴に基づいた疾患影響スコア(DIS)を開発した。彼らはDNA配列に基づいてこれらの特徴を予測するためにニューラルネットワークを訓練したよ。そして、これらの予測を組み合わせて、特定の変異の重要性を評価するスコアを作ったんだ。
シンプルな方法の必要性
ニューラルネットワークを使ったアプローチは強力だけど、複雑で解釈が難しいんだ。それで研究者たちは、計算の負担が少なくても同じかそれ以上の信号を見つけられないか、シンプルな方法を探し始めた。初期の発見では、局所的なGC含量、つまりDNA配列内の特定のDNA塩基(GとC)の数を調べるだけで、類似の関連性を見つけられるかもしれないと示唆されたよ。
局所的なGC含量による洞察
最初の調査では、局所的なGC含量とDISスコアとの強い関連が示された。これにより、研究者たちは局所的なGC含量だけを使っても同じ関連性の結果が得られるかもしれないと考えたんだ。彼らは局所的なGC含量に基づいて変異グループを比較し、確立されたゲノム変異を使ってこれらの関連性をテストしたよ。
これらの比較を行ったとき、局所的なGC含量は確かに以前の複雑なモデルに帰属されていた多くの関連性を説明できることがわかった。でも、局所的なGC含量が重要な信号を捉えることができても、他のユニークな配列の特徴も重要である可能性があることを認識したんだ。
特定の要因の調査
ASDが主に男性に影響を与えることを考慮して、研究者たちは、ASDの個体(プロバンド)とその兄弟姉妹の性差が遺伝子変異の局所的なGC含量にどう影響するかを調べたよ。最も強い信号は、プロバンドが男性で兄弟が女性の家族から得られた。これは、特定の遺伝子の近くにある変異が、プロバンドと兄弟の性別によって異なる影響を与えるという、より微妙な関係を示唆しているんだ。
この洞察を踏まえて、研究者たちは新しい分析手法「表現近傍配列関連研究(ENSAS)」を作った。これは、局所的なGC含量だけでなく、遺伝子の周りの特定の配列も考慮することで、より包括的な分析を可能にするんだ。
ENSASのフレームワークと分析
ENSASは、遺伝子発現の近傍を系統的に定義するように設計されたよ。各遺伝子について、発現パターンに基づいて近くの遺伝子を特定し、これらの遺伝子からの変異を分析に含めるんだ。この近傍に焦点を当てることで、ENSASは個々の遺伝子や変異だけを見るよりも見逃されるかもしれない関連性を見つけることができるんだ。
研究者たちがENSASをSSCデータに適用したとき、特に男性のプロバンドと女性の兄弟からの変異に注目して、彼らに割り当てられた遺伝子の上流に位置する変異に焦点を当てた。このターゲットを絞ったアプローチにより、ASDに有意に関連する局所的なGC含量の違いを特定する能力が向上したよ。
ENSAS分析からの結果
ENSASを使用して、研究者たちはプロバンドと兄弟の変異間で局所的なGC含量に有意な違いがあるいくつかの近傍を発見した。上位の近傍は、シナプス機能に関連する遺伝子が豊富に含まれていて、これらの遺伝的変化がASDに関与する重要な生物学的プロセスに関連している可能性があることを示唆しているんだ。
異なる組織でDNAがどれだけアクセス可能か、または閉じているかを調べるクロマチン状態に関する追加の分析も、観察された局所的なGC含量の違いを説明するのに役立った。結果は、特定のクロマチン状態がプロバンドからの変異間でより一般的であることを示していて、局所的なGC含量の違いに生物学的な基盤があることを示唆しているんだ。
関連信号の特異性の探求
検出された信号が単なるシーケンシングの技術的な問題によるものでないことを確認するために、研究者たちは同じシーケンシングレーンで処理された個体のデータセグメントを比較した。この分析の結果、重要な関連性はマッチするレーンのサンプル間でも持続していて、観察された信号はシーケンシングバッチ効果によって推進されていた可能性は低いことが示されたよ。
信号の特異性は、ENSASフレームワークを他のグループ、たとえば男性のプロバンドと男性の兄弟、女性のプロバンドと男性または女性の兄弟に適用することでさらにテストされた。これらの分析では、最も強い関連性が男性プロバンド・女性兄弟グループに特有であることが明らかになったんだ。
他のデータセットからの洞察
最後に、研究者たちはアイスランドの集団から得られた独立したデータセットにENSASを適用して、発見を検証しようとした。このデータセットには、同様の分析を可能にするトリオ(親と子供)の情報も含まれていた。でも、同じ方法論を適用したとき、研究者たちはアイスランドのデータには有意な関連が見られないことがわかった。これは、SSCデータセットで特定された信号がASDの表現型に特有である可能性を示唆しているんだ。
結論と今後の方向性
全体として、この研究はコーディングされていない遺伝的変異がASDのような複雑な特性を理解する上で重要な役割を果たすことを裏付けているよ。伝統的な方法と新しい分析手法の両方を使うことで、研究者たちはASDの遺伝的基盤や他の心理的状態に対する洞察を得られるんだ。この発見は、まれなコーディングされていない変異の重要性を明らかにするだけでなく、発見をより明確で解釈しやすくするために分析アプローチを簡素化する価値を強調している。
WGSデータが増え続け、より多くの集団が研究される中で、これらの方法を基にして、遺伝的な違いが多様なグループにおける複雑な特性にどのように関連するかを探ることが重要になるよ。今後の研究では、観察された遺伝的関連の背後にある生物学的メカニズムや、それがASDに関連する行動や症状にどのように変わっていくかを調査するかもしれないね。
タイトル: Identifying associations of de novo noncoding variants with autism through integration of gene expression, sequence and sex information
概要: Whole-genome sequencing (WGS) data is facilitating genome-wide identification of rare noncoding variants, while elucidating their roles in disease remains challenging. Towards this end, we first revisit a reported significant brain-related association signal of autism spectrum disorder (ASD) detected from de novo noncoding variants attributed to deep-learning and show that local GC content can capture similar association signals. We further show that the association signal appears driven by variants from male proband-female sibling pairs that are upstream of assigned genes. We then develop Expression Neighborhood Sequence Association Study (ENSAS), which utilizes gene expression correlations and sequence information, to more systematically identify phenotype-associated variant sets. Applying ENSAS to the same set of de novo variants, we identify gene expression-based neighborhoods showing significant ASD association signal, enriched for synapse-related gene ontology terms. For these top neighborhoods, we also identify chromatin states annotations of variants that are predictive of the proband-sibling local GC content differences. Our work provides new insights into associations of non-coding de novo mutations in ASD and presents an analytical framework applicable to other phenotypes.
著者: Jason Ernst, R. Li
最終更新: 2024-03-21 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.03.20.585624
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.03.20.585624.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。