Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Genética

Avanzando en estudios genéticos con la tubería MoBaPsychGen

Una nueva tubería mejora el control de calidad en datos genéticos de personas relacionadas.

― 6 minilectura


Mejora del Pipeline deMejora del Pipeline deDatos Genéticosinsights en la investigación genética.Nueva tubería mejora la precisión y los
Tabla de contenidos

En 2005, los investigadores publicaron el primer estudio que analizaba cómo los genes a lo largo de todo el genoma se relacionan con diferentes características en los humanos. Desde entonces, la investigación en este campo ha crecido un montón. Muchos estudios han involucrado grupos más grandes de participantes y mejores métodos para estimar Datos Genéticos. Esto ha llevado al descubrimiento de un montón de variaciones genéticas relacionadas con rasgos humanos. Con los avances en métodos estadísticos, los investigadores ahora pueden abordar preguntas cada vez más complicadas sobre genética.

Importancia del Control de Calidad en Estudios Genéticos

El control de calidad (CQ) en estudios genéticos es clave, especialmente al trabajar con datos de personas relacionadas. Los estudios familiares permiten a los investigadores analizar factores genéticos de maneras que no son posibles con individuos no relacionados. Por ejemplo, estos estudios pueden ayudar a explorar cómo se transmiten los rasgos genéticos a través de generaciones. Sin embargo, para asegurar resultados válidos, los investigadores deben seguir procedimientos específicos de CQ. La Pedigree Imputation Consortium Pipeline (PICOPILI) es una herramienta comúnmente usada para control de calidad, pero tiene limitaciones, especialmente con grandes conjuntos de datos.

Resumen de la Cohorte MoBa

El Estudio de la Cohorte Noruega de Madre, Padre e Hijo (MoBa) es un estudio significativo que incluye datos de embarazos y nacimientos en Noruega. La cohorte abarca una variedad de Relaciones familiares, como gemelos, hermanos y pares de padre-hijo. La complejidad de las relaciones familiares y los diferentes métodos utilizados para recoger datos genéticos en MoBa resaltan la necesidad de un pipeline de CQ especializado.

En MoBa, no solo se incluyeron varios tipos de familias, sino que las muestras genéticas también se recogieron a lo largo de varios años y a través de diferentes proyectos. Esta variación puede complicar el procesamiento y análisis de los datos.

Desarrollo del Pipeline MoBaPsychGen

Para abordar los desafíos enfrentados en MoBa, los investigadores desarrollaron el pipeline MoBaPsychGen para CQ e Imputación de datos genéticos. Este pipeline consiste en diferentes etapas, incluyendo chequeos antes y después de la imputación de datos. El objetivo era asegurarse de que las complejas relaciones familiares y las variaciones en los métodos de recolección de datos se manejaran adecuadamente.

Armonización de Datos

El primer paso en el pipeline fue armonizar los datos genéticos. Esto implicó actualizar códigos genéticos, eliminar marcadores genéticos problemáticos y asegurarse de que los datos coincidieran con los estándares de referencia utilizados para el análisis.

Identificación de Subpoblaciones

Luego, los investigadores realizaron chequeos de CQ para identificar diferentes grupos de individuos dentro de la cohorte según su trasfondo genético. Este paso ayuda a prevenir resultados engañosos que podrían surgir de diferencias en variación genética entre poblaciones.

Control de Calidad de Subpoblaciones

Después de identificar subpoblaciones, se realizaron exhaustivos chequeos de CQ. Esto incluyó eliminar individuos y marcadores genéticos que no cumplían con ciertos estándares de calidad, asegurando que solo se usaran los datos de mejor calidad para futuros análisis.

Verificación de Relaciones y Precisión

Una parte significativa de este proceso implicó verificar y confirmar relaciones familiares. Al analizar datos genéticos, los investigadores podían comprobar las relaciones reportadas e identificar cualquier error en las conexiones familiares. Este paso es crítico porque relaciones incorrectas pueden llevar a resultados sesgados en el análisis genético.

Manejo de Datos Genéticos de Individuos Relacionados

El pipeline MoBaPsychGen permite a los investigadores realizar estudios genéticos en familias de manera efectiva. Al completar procesos exhaustivos de CQ y asegurar relaciones familiares precisas, los investigadores pueden aprovechar los datos de individuos relacionados para proporcionar conocimientos más profundos sobre las influencias genéticas en rasgos y resultados de salud.

Hallazgos del Estudio MoBa

Después de aplicar el pipeline MoBaPsychGen, los investigadores procesaron datos de más de 234,500 muestras. El conjunto de datos resultante incluyó un enorme número de variaciones genéticas y un conjunto diverso de individuos. Este conjunto de datos integral es valioso para estudiar factores genéticos en diversos problemas de salud y desarrollo.

Análisis de Relaciones Familiares

El pipeline de CQ permitió a los investigadores identificar muchas relaciones familiares dentro de la cohorte. Esto incluyó casi 23,000 pares de hermanos completos y más de 117,000 pares de padre-hijo. La capacidad de analizar datos familiares tan completos abre puertas a varias oportunidades de investigación, como examinar cómo se heredan rasgos específicos.

Importancia de Datos Precisos

Tener datos de alta calidad es esencial en estudios genéticos, especialmente en investigaciones basadas en familias. El pipeline MoBaPsychGen aseguró que los datos fueran confiables y bien organizados, haciéndolos adecuados para análisis avanzados. Esta organización ayuda a los investigadores a sacar conclusiones precisas sobre los factores genéticos que influyen en diferentes condiciones de salud y rasgos.

Direcciones Futuras

El pipeline MoBaPsychGen ha mostrado resultados prometedores, pero los investigadores reconocen la necesidad de extender su uso más allá de la subpoblación europea incluida en el CQ inicial. Se están realizando esfuerzos para adaptar y expandir el pipeline para incluir poblaciones más diversas y otras características complejas.

A medida que el campo de la genética evoluciona y la investigación se vuelve más aplicable a problemas de salud del mundo real, el uso de procesos de CQ integrales será fundamental. Así, los investigadores pueden asegurarse de que sus hallazgos sean significativos y aplicables a diferentes poblaciones.

Conclusión

El pipeline MoBaPsychGen representa un avance significativo en el procesamiento de datos genéticos de individuos relacionados. Al enfocarse en un control de calidad exhaustivo, verificaciones de relaciones precisas y un manejo adecuado de datos complejos, este pipeline permite obtener valiosos conocimientos sobre factores genéticos que influyen en la salud humana. A medida que los investigadores continúan explorando datos genéticos de grupos cada vez más diversos, las lecciones aprendidas del pipeline MoBaPsychGen jugarán un papel crucial en la conformación de futuros estudios en genética y salud pública.

El trabajo realizado en esta área podría llevar a una mejor comprensión de varias enfermedades y rasgos, así como mejores estrategias para prevención y tratamiento. La capacidad de analizar efectivamente datos genéticos de familias es crítica para descubrir los mecanismos subyacentes de la salud y la enfermedad. Así, el pipeline MoBaPsychGen establece una sólida base para la investigación en genética en curso y futura.

Fuente original

Título: The Norwegian Mother, Father, and Child cohort study (MoBa) genotyping data resource: MoBaPsychGen pipeline v.1

Resumen: BackgroundThe Norwegian Mother, Father, and Child Cohort Study (MoBa) is a population-based pregnancy cohort, which includes approximately 114,500 children, 95,200 mothers, and 75,200 fathers. Genotyping of MoBa has been conducted through multiple research projects, spanning several years; using varying selection criteria, genotyping arrays, and genotyping centres. MoBa contains numerous interrelated families, which necessitated the implementation of a family-based quality control (QC) pipeline that verifies and accounts for diverse types of relatedness. MethodsThe MoBaPsychGen pipeline, comprising pre-imputation QC, phasing, imputation, and post-imputation QC, was developed based on current best-practice protocols and implemented to account for the complex structure of the MoBa genotype data. The pipeline includes QC on both single nucleotide polymorphism (SNP) and individual level. Phasing and imputation were performed using the publicly available Haplotype Reference Consortium release 1.1 panel as a reference. Information from the Medical Birth Registry of Norway and MoBa questionnaires were used to identify biological sex, year of birth, reported parent-offspring (PO) relationships, and multiple births (only available in the offspring generation). ResultsIn total, 207,569 unique individuals (90% of the unique individuals included in the study) and 6,981,748 autosomal SNPs passed the MoBaPsychGen pipeline. A further 174,462 chromosome X and 3,200 PAR SNPs are available in a subset of these individuals (N = 204,913 and 135,593, respectively). The relatedness checks performed throughout the pipeline allowed identification of within-generation and across-generation first-degree, second-degree, and third-degree relatives. The individuals passing post-imputation QC comprised 64,471 families ranging in size from singletons to 84 unique individuals (singletons are included as families as other family members may not have been genotyped, imputed, or passed post-imputation QC). The relationships identified include 287 monozygotic twin pairs, 22,884 full siblings, 117,004 PO pairs, 23,299 second-degree relative pairs, and 10,828 third-degree relative pairs. DiscussionMoBa contains a highly complex relatedness structure, with a variety of family structures including singletons, PO duos, full (mother, father, child) PO trios, nuclear families, blended families, and extended families. The availability of robustly quality-controlled genetic data for such a large cohort with a unique extended family structure will allow many novel research questions to be addressed. Furthermore, the MoBaPsychGen pipeline has potential utility in similar cohorts.

Autores: Elizabeth C Corfield, A. A. Shadrin, O. Frei, Z. Rahman, A. Lin, L. Athanasiu, B. Cevdet Akdeniz, T. Tekin Filiz, L. Hannigan, R. E. Wootton, C. Austerberry, A. Hughes, M. Tesli, L. T. Westlye, H. Stefansson, K. Stefansson, P. R. Njolstad, P. Magnus, N. M. Davies, V. Appadurai, G. Hemani, E. Hovig, T. Zayats, H. Ask, T. Reichborn-Kjennerud, O. A. Andreassen, A. Havdahl

Última actualización: 2024-05-07 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2022.06.23.496289

Fuente PDF: https://www.biorxiv.org/content/10.1101/2022.06.23.496289.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares