Simple Science

最先端の科学をわかりやすく解説

# 生物学# 遺伝学

MoBaPsychGenパイプラインで遺伝子研究を進める

新しいパイプラインは、親族の遺伝データの品質管理を向上させる。

― 1 分で読む


遺伝子データパイプラインの遺伝子データパイプラインの改善察が向上した。新しいパイプラインで遺伝子研究の精度と洞
目次

2005年、研究者たちは全ゲノムにわたる遺伝子と人間のさまざまな特性との関連を調べた最初の研究を発表した。それ以来、この分野の研究は大きく進展してきた。多くの研究では、より大きな参加者グループと遺伝データを推定するためのより良い方法が用いられている。その結果、人間の特性に関連する膨大な数の遺伝的変異が発見された。統計手法の進展により、研究者たちは遺伝学に関するますます複雑な質問に取り組むことができるようになった。

遺伝研究における品質管理の重要性

遺伝研究における品質管理(QC)は特に親族データを扱うときに重要だ。家族ベースの研究では、無関係な個人では不可能な方法で遺伝的要因を分析できる。たとえば、これらの研究は遺伝的特性が世代を超えてどのように受け継がれるかを探るのに役立つ。ただし、有効な結果を得るためには、特定のQC手順に従う必要がある。Pedigree Imputation Consortium Pipeline(PICOPILI)は一般的に使用されるQCツールだが、大規模データセットでは制限がある。

MoBaコホートの概要

ノルウェー母親・父親・子どもコホート研究(MoBa)は、ノルウェーにおける妊娠と出生のデータを含む重要な研究だ。このコホートには、双子、兄弟姉妹、親子ペアなど、さまざまな家族関係が含まれている。家族関係の複雑さやMoBaでの遺伝データ収集方法の違いから、専門的なQCパイプラインの必要性が浮き彫りになっている。

MoBaでは、さまざまな家族タイプが含まれているだけでなく、遺伝サンプルも数年にわたりさまざまなプロジェクトを通じて収集された。このバリエーションは、データ処理や分析において複雑さを引き起こす可能性がある。

MoBaPsychGenパイプラインの開発

MoBaで直面した課題に対処するため、研究者たちは遺伝データのQCと補完を行うためのMoBaPsychGenパイプラインを開発した。このパイプラインは、データ補完前後のチェックを含むいくつかの段階から構成されている。複雑な家族関係やデータ収集方法の違いを適切に扱うことが目的だった。

データの調和

パイプラインの最初のステップは、遺伝データを調和させることだった。これには、遺伝コードの更新、有問題な遺伝マーカーの除去、分析に使用される参照基準にデータが一致するようにすることが含まれる。

サブポピュレーションの特定

次に、研究者たちはコホート内の個人を遺伝的背景に基づいて異なるグループに分けるQCチェックを実施した。このステップは、人口間の遺伝的変異の違いから生じる誤解を防ぐのに役立つ。

サブポピュレーションの品質管理

サブポピュレーションを特定した後、徹底的なQCチェックを行った。特定の品質基準を満たさない個人や遺伝マーカーを除去し、質の高いデータのみがさらなる分析に使用されるようにした。

関係と正確性の確認

このプロセスの重要な部分は、家族関係の確認と検証だった。遺伝データを分析することによって、報告された関係を確認し、家族のつながりにおけるエラーを特定できた。このステップは、誤った関係が遺伝分析に偏った結果をもたらす可能性があるため、重要だ。

関連個体からの遺伝データの取り扱い

MoBaPsychGenパイプラインは、研究者が家族内での遺伝研究を効果的に行えるようにする。徹底的なQCプロセスを完了し、正確な家族関係を確保することで、研究者は関連個人からのデータを活用して特性や健康結果に対する遺伝的影響をより深く理解できる。

MoBa研究からの成果

MoBaPsychGenパイプラインを適用した後、研究者たちは234,500以上のサンプルからデータを処理した。その結果得られたデータセットには、膨大な数の遺伝的変異と多様な個人が含まれている。この包括的なデータセットは、さまざまな健康や発達の問題における遺伝的要因を研究するのに貴重だ。

家族関係の分析

QCパイプラインにより、研究者たちはコホート内の多くの家族関係を特定することができた。これには、ほぼ23,000組の全兄弟と117,000以上の親子ペアが含まれている。このような包括的な家族データを分析する能力は、特定の特性がどのように遺伝するかを調査するなど、さまざまな研究の機会を開く。

正確なデータの重要性

高品質なデータを持つことは、特に家族ベースの研究において遺伝研究で重要だ。MoBaPsychGenパイプラインは、データの信頼性と組織化を確保し、高度な分析に適したものにした。この組織化により、研究者はさまざまな健康状態や特性に影響を与える遺伝的要因について正確な結論を導き出すことができる。

今後の方向性

MoBaPsychGenパイプラインは有望な結果を示しているが、研究者たちは最初のQCに含まれた欧州のサブポピュレーションを超えてその使用を拡張する必要性を認識している。より多様な集団や他の複雑な特性を含むようにパイプラインを適応・拡張する努力が進んでいる。

遺伝学の分野が進化し、研究が現実の健康問題により適用可能になるにつれて、包括的なQCプロセスの使用が基本的になる。これにより、研究者は、彼らの発見がさまざまな集団において意味があり適用可能であることを保証できる。

結論

MoBaPsychGenパイプラインは、親族からの遺伝データの処理において重要な進展を示している。徹底的な品質管理、正確な関係チェック、複雑なデータの適切な取り扱いに焦点を当てることで、このパイプラインは人間の健康に影響を与える遺伝的要因に関する貴重な洞察を提供する。研究者たちがますます多様なグループからの遺伝データを探求し続ける中で、MoBaPsychGenパイプラインから得られた教訓は、遺伝学や公衆衛生の未来の研究を形作る上で重要な役割を果たすだろう。

この分野での取り組みは、さまざまな病気や特性の理解を深めるだけでなく、予防や治療のためのより良い戦略にもつながる可能性がある。家族からの遺伝データを効果的に分析する能力は、健康と病気の根本的なメカニズムを解明するために重要だ。したがって、MoBaPsychGenパイプラインは、遺伝学における今後の研究の強固な基盤を築いている。

オリジナルソース

タイトル: The Norwegian Mother, Father, and Child cohort study (MoBa) genotyping data resource: MoBaPsychGen pipeline v.1

概要: BackgroundThe Norwegian Mother, Father, and Child Cohort Study (MoBa) is a population-based pregnancy cohort, which includes approximately 114,500 children, 95,200 mothers, and 75,200 fathers. Genotyping of MoBa has been conducted through multiple research projects, spanning several years; using varying selection criteria, genotyping arrays, and genotyping centres. MoBa contains numerous interrelated families, which necessitated the implementation of a family-based quality control (QC) pipeline that verifies and accounts for diverse types of relatedness. MethodsThe MoBaPsychGen pipeline, comprising pre-imputation QC, phasing, imputation, and post-imputation QC, was developed based on current best-practice protocols and implemented to account for the complex structure of the MoBa genotype data. The pipeline includes QC on both single nucleotide polymorphism (SNP) and individual level. Phasing and imputation were performed using the publicly available Haplotype Reference Consortium release 1.1 panel as a reference. Information from the Medical Birth Registry of Norway and MoBa questionnaires were used to identify biological sex, year of birth, reported parent-offspring (PO) relationships, and multiple births (only available in the offspring generation). ResultsIn total, 207,569 unique individuals (90% of the unique individuals included in the study) and 6,981,748 autosomal SNPs passed the MoBaPsychGen pipeline. A further 174,462 chromosome X and 3,200 PAR SNPs are available in a subset of these individuals (N = 204,913 and 135,593, respectively). The relatedness checks performed throughout the pipeline allowed identification of within-generation and across-generation first-degree, second-degree, and third-degree relatives. The individuals passing post-imputation QC comprised 64,471 families ranging in size from singletons to 84 unique individuals (singletons are included as families as other family members may not have been genotyped, imputed, or passed post-imputation QC). The relationships identified include 287 monozygotic twin pairs, 22,884 full siblings, 117,004 PO pairs, 23,299 second-degree relative pairs, and 10,828 third-degree relative pairs. DiscussionMoBa contains a highly complex relatedness structure, with a variety of family structures including singletons, PO duos, full (mother, father, child) PO trios, nuclear families, blended families, and extended families. The availability of robustly quality-controlled genetic data for such a large cohort with a unique extended family structure will allow many novel research questions to be addressed. Furthermore, the MoBaPsychGen pipeline has potential utility in similar cohorts.

著者: Elizabeth C Corfield, A. A. Shadrin, O. Frei, Z. Rahman, A. Lin, L. Athanasiu, B. Cevdet Akdeniz, T. Tekin Filiz, L. Hannigan, R. E. Wootton, C. Austerberry, A. Hughes, M. Tesli, L. T. Westlye, H. Stefansson, K. Stefansson, P. R. Njolstad, P. Magnus, N. M. Davies, V. Appadurai, G. Hemani, E. Hovig, T. Zayats, H. Ask, T. Reichborn-Kjennerud, O. A. Andreassen, A. Havdahl

最終更新: 2024-05-07 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2022.06.23.496289

ソースPDF: https://www.biorxiv.org/content/10.1101/2022.06.23.496289.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事