Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Genetica

Avanzando gli studi genetici con il pipeline MoBaPsychGen

Un nuovo sistema migliora il controllo qualità nei dati genetici di individui imparentati.

― 5 leggere min


Miglioramento delMiglioramento delPipeline di Dati Geneticile informazioni nella ricerca genetica.Nuovo sistema migliora l'accuratezza e
Indice

Nel 2005, i ricercatori hanno pubblicato il primo studio che esaminava come i geni nell'intero genoma si relazionano a vari tratti negli esseri umani. Da allora, la ricerca in questo campo è cresciuta significativamente. Molti studi hanno coinvolto gruppi più ampi di partecipanti e metodi migliori per stimare i Dati Genetici. Questo ha portato alla scoperta di un numero vasto di variazioni genetiche collegate ai tratti umani. Con i miglioramenti nei metodi statistici, i ricercatori possono ora affrontare domande sempre più complicate sulla genetica.

Importanza del Controllo Qualità negli Studi Genetici

Il controllo qualità (CQ) negli studi genetici è fondamentale, soprattutto quando si lavora con dati di individui imparentati. Gli studi basati sulla famiglia permettono ai ricercatori di analizzare fattori genetici in modi che non sono possibili con individui non imparentati. Ad esempio, questi studi possono aiutare a esplorare come i tratti genetici vengono trasmessi attraverso le generazioni. Tuttavia, per garantire risultati validi, i ricercatori devono seguire procedure specifiche di CQ. Il Pedigree Imputation Consortium Pipeline (PICOPILI) è uno strumento comunemente usato per il controllo qualità, ma ha delle limitazioni, specialmente con grandi dataset.

Panoramica della Coorte MoBa

Lo Studio Norvegese Madre, Padre e Bambino (MoBa) è uno studio significativo che comprende dati su gravidanze e nascite in Norvegia. La coorte include vari tipi di Relazioni Familiari, come gemelli, fratelli e coppie genitore-figlio. La complessità delle relazioni familiari e i diversi metodi usati per raccogliere dati genetici in MoBa evidenziano la necessità di un pipeline di CQ specializzata.

In MoBa, non solo sono stati inclusi vari tipi di famiglie, ma i campioni genetici sono stati raccolti nel corso di diversi anni e attraverso diversi progetti. Questa variazione può portare a complicazioni nel processo e nell'analisi dei dati.

Sviluppo del Pipeline MoBaPsychGen

Per affrontare le sfide nel MoBa, i ricercatori hanno sviluppato il pipeline MoBaPsychGen per il CQ e l'Imputazione dei dati genetici. Questo pipeline consiste in diverse fasi, comprese le verifiche prima e dopo l'imputazione dei dati. L'obiettivo era garantire che le complesse relazioni familiari e le variazioni nei metodi di raccolta dei dati fossero gestite in modo adeguato.

Armonizzazione dei Dati

Il primo passo nel pipeline è stato armonizzare i dati genetici. Questo ha comportato l'aggiornamento dei codici genetici, la rimozione di marcatori genetici problematici e l'assicurarsi che i dati corrispondessero agli standard di riferimento utilizzati per l'analisi.

Identificazione delle Sottopopolazioni

Successivamente, i ricercatori hanno effettuato controlli di CQ per identificare differenti gruppi di individui all'interno della coorte in base al loro background genetico. Questo passo aiuta a prevenire risultati fuorvianti che potrebbero derivare da differenze nella variazione genetica tra le popolazioni.

Controllo Qualità delle Sottopopolazioni

Dopo aver identificato le sottopopolazioni, sono stati eseguiti controlli di CQ approfonditi. Questo ha incluso la rimozione di individui e marcatori genetici che non soddisfacevano specifici standard di qualità, assicurando che solo i dati di migliore qualità fossero utilizzati per ulteriori analisi.

Verifica delle Relazioni e Accuratezza

Una parte significativa di questo processo ha coinvolto la verifica e la conferma delle relazioni familiari. Analizzando i dati genetici, i ricercatori potevano verificare le relazioni segnalate e identificare eventuali errori nei legami familiari. Questo passo è critico perché relazioni errate possono portare a risultati distorti nell'analisi genetica.

Gestione dei Dati Genetici da Individui Imparentati

Il pipeline MoBaPsychGen consente ai ricercatori di condurre studi genetici in famiglie in modo efficace. Completando processi di CQ approfonditi e assicurando relazioni familiari accurate, i ricercatori possono sfruttare i dati degli individui imparentati per fornire approfondimenti più profondi sulle influenze genetiche sui tratti e sui risultati di salute.

Risultati dello Studio MoBa

Dopo aver applicato il pipeline MoBaPsychGen, i ricercatori hanno elaborato dati provenienti da oltre 234.500 campioni. Il dataset risultante includeva un'incredibile quantità di variazioni genetiche e un insieme diversificato di individui. Questo dataset completo è prezioso per studiare i fattori genetici legati a vari problemi di salute e sviluppo.

Analisi delle Relazioni Familiari

Il pipeline di CQ ha permesso ai ricercatori di identificare molte relazioni familiari all'interno della coorte. Questo ha incluso quasi 23.000 coppie di fratelli e oltre 117.000 coppie genitore-figlio. La possibilità di analizzare dati familiari così completi apre porte a molteplici opportunità di ricerca, come esaminare come vengono ereditati specifici tratti.

Importanza dei Dati Accurati

Avere dati di alta qualità è essenziale negli studi genetici, specialmente nella ricerca basata sulla famiglia. Il pipeline MoBaPsychGen ha garantito che i dati fossero affidabili e ben organizzati, rendendoli adatti per analisi avanzate. Questa organizzazione aiuta i ricercatori a trarre conclusioni accurate sui fattori genetici che influenzano diverse condizioni di salute e tratti.

Direzioni Future

Il pipeline MoBaPsychGen ha mostrato risultati promettenti, ma i ricercatori riconoscono la necessità di estenderne l'uso oltre la sottopopolazione europea inclusa nel CQ iniziale. Sono in corso sforzi per adattare ed espandere il pipeline per includere popolazioni più diversificate e altre caratteristiche complesse.

Man mano che il campo della genetica evolve e la ricerca diventa più applicabile a problemi di salute nel mondo reale, l'uso di processi di CQ completi sarà fondamentale. In questo modo, i ricercatori possono garantire che i loro risultati siano significativi e applicabili a diverse popolazioni.

Conclusione

Il pipeline MoBaPsychGen rappresenta un avanzamento significativo nell'elaborazione dei dati genetici da individui imparentati. Focalizzandosi su un controllo qualità approfondito, verifiche di relazione accurate e gestione appropriata di dati complessi, questo pipeline consente di ottenere preziosi approfondimenti sui fattori genetici che influenzano la salute umana. Man mano che i ricercatori continuano a esplorare dati genetici da gruppi sempre più diversificati, le lezioni apprese dal pipeline MoBaPsychGen giocheranno un ruolo cruciale nel plasmare futuri studi in genetica e salute pubblica.

Il lavoro svolto in quest'area potrebbe portare a una migliore comprensione di varie malattie e tratti, oltre a strategie migliori per la prevenzione e il trattamento. La capacità di analizzare efficacemente i dati genetici delle famiglie è fondamentale per scoprire i meccanismi sottostanti alla salute e alla malattia. Pertanto, il pipeline MoBaPsychGen stabilisce una base solida per la ricerca continua e futura in genetica.

Fonte originale

Titolo: The Norwegian Mother, Father, and Child cohort study (MoBa) genotyping data resource: MoBaPsychGen pipeline v.1

Estratto: BackgroundThe Norwegian Mother, Father, and Child Cohort Study (MoBa) is a population-based pregnancy cohort, which includes approximately 114,500 children, 95,200 mothers, and 75,200 fathers. Genotyping of MoBa has been conducted through multiple research projects, spanning several years; using varying selection criteria, genotyping arrays, and genotyping centres. MoBa contains numerous interrelated families, which necessitated the implementation of a family-based quality control (QC) pipeline that verifies and accounts for diverse types of relatedness. MethodsThe MoBaPsychGen pipeline, comprising pre-imputation QC, phasing, imputation, and post-imputation QC, was developed based on current best-practice protocols and implemented to account for the complex structure of the MoBa genotype data. The pipeline includes QC on both single nucleotide polymorphism (SNP) and individual level. Phasing and imputation were performed using the publicly available Haplotype Reference Consortium release 1.1 panel as a reference. Information from the Medical Birth Registry of Norway and MoBa questionnaires were used to identify biological sex, year of birth, reported parent-offspring (PO) relationships, and multiple births (only available in the offspring generation). ResultsIn total, 207,569 unique individuals (90% of the unique individuals included in the study) and 6,981,748 autosomal SNPs passed the MoBaPsychGen pipeline. A further 174,462 chromosome X and 3,200 PAR SNPs are available in a subset of these individuals (N = 204,913 and 135,593, respectively). The relatedness checks performed throughout the pipeline allowed identification of within-generation and across-generation first-degree, second-degree, and third-degree relatives. The individuals passing post-imputation QC comprised 64,471 families ranging in size from singletons to 84 unique individuals (singletons are included as families as other family members may not have been genotyped, imputed, or passed post-imputation QC). The relationships identified include 287 monozygotic twin pairs, 22,884 full siblings, 117,004 PO pairs, 23,299 second-degree relative pairs, and 10,828 third-degree relative pairs. DiscussionMoBa contains a highly complex relatedness structure, with a variety of family structures including singletons, PO duos, full (mother, father, child) PO trios, nuclear families, blended families, and extended families. The availability of robustly quality-controlled genetic data for such a large cohort with a unique extended family structure will allow many novel research questions to be addressed. Furthermore, the MoBaPsychGen pipeline has potential utility in similar cohorts.

Autori: Elizabeth C Corfield, A. A. Shadrin, O. Frei, Z. Rahman, A. Lin, L. Athanasiu, B. Cevdet Akdeniz, T. Tekin Filiz, L. Hannigan, R. E. Wootton, C. Austerberry, A. Hughes, M. Tesli, L. T. Westlye, H. Stefansson, K. Stefansson, P. R. Njolstad, P. Magnus, N. M. Davies, V. Appadurai, G. Hemani, E. Hovig, T. Zayats, H. Ask, T. Reichborn-Kjennerud, O. A. Andreassen, A. Havdahl

Ultimo aggiornamento: 2024-05-07 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2022.06.23.496289

Fonte PDF: https://www.biorxiv.org/content/10.1101/2022.06.23.496289.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili