Investigando el papel de las variantes estructurales en las enfermedades
La investigación revela conexiones importantes entre variantes estructurales y diversas enfermedades.
― 7 minilectura
Tabla de contenidos
- Importancia de las Variantes Estructurales
- Creando un Panel de Referencia
- Características de las Variantes Estructurales
- Imputación de Variantes Estructurales
- Explorando Asociaciones con Enfermedades
- Identificando Genes Relevantes para Enfermedades
- El Futuro de la Investigación de Variantes Estructurales
- Conclusión
- Fuente original
En los últimos años, los científicos han estado trabajando duro para entender la relación entre nuestros genes y varias enfermedades. Una área importante de estudio se centra en cambios pequeños en nuestro ADN llamados Variantes de un solo nucleótido (SNVs) y pequeñas inserciones o deleciones. Estas alteraciones a menudo se examinan en grandes estudios conocidos como estudios de asociación de todo el genoma (GWAS). Sin embargo, un tipo diferente de cambio genético, conocido como Variantes Estructurales (SVs), que son más grandes de 50 pares de bases, no ha recibido tanta atención, a pesar de que también juegan roles significativos en las enfermedades.
Importancia de las Variantes Estructurales
Cada persona tiene miles de SVs que pueden superponerse con genes o áreas que controlan cómo funcionan los genes. Esta conexión puede ayudar a los investigadores a identificar los cambios genéticos específicos que llevan a enfermedades. Algunos estudios en poblaciones únicas ya han demostrado que mirar de cerca las SVs puede ayudar a los investigadores a encontrar variantes genéticas influyentes relacionadas con enfermedades.
Desafortunadamente, detectar estas SVs usando métodos tradicionales de secuenciación de ADN a menudo es complicado porque las SVs pueden ser mucho más grandes que las lecturas estándar producidas por estos métodos. La secuenciación de lectura larga es un método más nuevo que puede capturar estas variantes más grandes de manera más confiable, pero suele ser más costoso y no siempre es factible para grandes estudios.
Para abordar esto, los investigadores han desarrollado paneles de referencia que pueden ayudar a llenar los vacíos al estudiar SVs en grandes conjuntos de datos. Por ejemplo, en el Biobanco del Reino Unido, usar estos paneles permite a los científicos acelerar la investigación que conecta genes con diversas enfermedades y tal vez incluso descubrir nuevos objetivos de medicamentos.
Creando un Panel de Referencia
Un equipo de investigadores creó un panel de imputación disponible públicamente que combina datos de muchos grupos ancestrales diferentes usando secuenciación de lectura larga. Este panel ayuda a los investigadores a predecir con precisión las SVs en otros conjuntos de datos, como el Biobanco del Reino Unido. Su estudio incluyó la secuenciación de lectura larga de 906 individuos del Proyecto 1000 Genomas. Cada muestra proporcionó una gran cantidad de información sobre la diversidad de SVs en diferentes poblaciones.
Los resultados mostraron que el panel fue efectivo para identificar SVs, facilitando el estudio de su relación con las enfermedades. Los investigadores observaron una amplia gama de SVs dentro de diferentes antecedentes genéticos, revelando una red compleja de diversidad genética.
Características de las Variantes Estructurales
Los investigadores identificaron 107,445 SVs de alta calidad usando un programa diseñado para secuenciación de lectura larga. Sus hallazgos destacaron varios tipos de SVs, siendo las inserciones las más comunes, seguidas de las deleciones, inversiones y duplicaciones. La mayoría de las SVs identificadas eran raras, con muchas teniendo una frecuencia alélica menor a 0.005.
Además, descubrieron que los tamaños de las SVs variaban ampliamente, con muchas deleciones e inserciones cayendo entre 50 y 1000 pares de bases. Algunas SVs eran mucho más grandes, mostrando la necesidad de una interpretación cuidadosa de estos datos para evitar artefactos potenciales.
También compararon sus llamadas de secuenciación de lectura larga con datos anteriores obtenidos de secuenciación de lectura corta y encontraron que el método de lectura larga capturó un número significativo de variantes que se habían pasado por alto antes.
Imputación de Variantes Estructurales
Usando el panel de imputación, los investigadores imputaron SVs en los genomas de aproximadamente 488,130 participantes del Biobanco del Reino Unido. Confirmaron que la mayoría de las variantes genotipadas coincidían con el panel de referencia, lo que permitió una imputación de alta calidad.
La calidad de la imputación varió según diferentes factores, incluyendo el tipo de variante, su frecuencia y la complejidad de la región genómica. Notablemente, las variantes más comunes tendían a producir métricas de imputación de mejor calidad que las raras. Sin embargo, en general, la imputación de SVs proporcionó una base confiable para estudios posteriores.
Explorando Asociaciones con Enfermedades
Para ilustrar la utilidad del panel, los investigadores realizaron estudios de asociación de todo el genoma dirigidos a varios rasgos relacionados con enfermedades respiratorias y metabólicas. Encontraron numerosas asociaciones significativas entre SVs y estas condiciones de salud, enfatizando cuán importantes pueden ser las variantes estructurales para entender los factores genéticos de las enfermedades.
Al filtrar asociaciones de baja calidad, redujeron a 3,858 asociaciones de SVs que se consideraron notables. Su análisis también destacó el impacto potencial de estas SVs en los niveles de proteínas en la sangre, vinculando aún más las variaciones genéticas con los resultados de salud.
Identificando Genes Relevantes para Enfermedades
Después de estos hallazgos, los investigadores evaluaron si las asociaciones de SV identificadas podían ayudar a señalar genes potencialmente relevantes conectados con enfermedades específicas. Compararon sus resultados con estudios anteriores que se centraron únicamente en variantes de un solo nucleótido y encontraron que muchas de las SVs se superponían con genes vinculados a la salud respiratoria.
También descubrieron que algunas SVs ofrecían información adicional en ciertas ubicaciones genómicas, proporcionando una imagen más completa de cómo los genes influyen en las enfermedades. Por ejemplo, varias SVs estaban vinculadas a genes importantes involucrados en la función pulmonar y enfermedades respiratorias.
El Futuro de la Investigación de Variantes Estructurales
La secuenciación de lectura larga se destaca por su capacidad para mejorar nuestra comprensión de los factores genéticos vinculados a diversas enfermedades. Sin embargo, sus altos costos han limitado su adopción a gran escala en la investigación. El equipo sugiere que su enfoque de imputación de SV puede servir como una solución práctica, permitiendo a los investigadores analizar una gama más amplia de cambios genéticos sin incurrir en costos adicionales.
El nuevo panel de imputación se puede expandir para incluir otros biobancos internacionales también, permitiendo un conjunto de datos aún más grande de SVs. Esto podría ayudar a desvelar más asociaciones genéticas con enfermedades y avanzar en nuestra comprensión de problemas de salud complejos.
Conclusión
El trabajo realizado por estos investigadores mejora significativamente el campo de la genética al incorporar variantes estructurales en el análisis de asociaciones gen-gente. Sus hallazgos enfatizan el valor de las SVs y destacan cuánta más investigación se necesita para entender completamente sus implicaciones.
Este estudio allana el camino para una exploración adicional sobre cómo las SVs pueden influir en la salud y la enfermedad, potencialmente conduciendo a terapias mejor dirigidas y enfoques de medicina personalizada basados en nuestros perfiles genéticos únicos. El desarrollo continuo de recursos como el panel de imputación SV será crucial en este esfuerzo, ampliando nuestras herramientas para la investigación genética.
Título: Imputation of structural variants using a multi-ancestry long-read sequencing panel enables identification of disease associations
Resumen: Advancements in long-read sequencing technology have accelerated the study of large structural variants (SVs). We created a curated, publicly available, multi-ancestry SV imputation panel by long-read sequencing 888 samples from the 1000 Genomes Project. This high-quality panel was used to impute SVs in approximately 500,000 UK Biobank participants. We demonstrated the feasibility of conducting genome-wide SV association studies at biobank scale using 32 disease-relevant phenotypes related to respiratory, cardiometabolic and liver diseases, in addition to 1,463 protein levels. This analysis identified thousands of genome-wide significant SV associations, including hundreds of conditionally independent signals, thereby enabling novel biological insights. Focusing on genetic association studies of lung function as an example, we demonstrate the added value of SVs for prioritising causal genes at gene-rich loci compared to traditional GWAS using only short variants. We envision that future post-GWAS gene-prioritisation workflows will incorporate SV analyses using this SV imputation panel and framework.
Autores: Zhihao Ding, B. Noyvert, A. M. Erzurumluoglu, D. Drichel, S. Omland, T. F. M. Andlauer, S. Mueller, L. Sennels, C. Becker, A. Kantorovich, B. A. Bartholdy, I. Braenne, J. C. Bolivar-Lopez, C. Mistrellides, G. M. Belbin, J. H. Li, J. K. Pickrell, J. de Jong, J. Arora, Y. Hu, Boehringer Ingelheim - Global Computational Biology and Digital Sciences, C. R. Wood, J. M. Kriegl, N. Podduturi, J. N. Jensen, J. Stutzki
Última actualización: 2023-12-22 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2023.12.20.23300308
Fuente PDF: https://www.medrxiv.org/content/10.1101/2023.12.20.23300308.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.