Un nuevo método para analizar rasgos genéticos
GARFIELD adopta un enfoque nuevo para entender las interacciones genéticas en los rasgos.
― 6 minilectura
Tabla de contenidos
La investigación genética busca entender cómo se heredan diferentes Rasgos o enfermedades. Un método popular para hacer esto se llama Estudios de Asociación del Genoma Completo (GWAS). Este enfoque analiza muchas Variantes genéticas diferentes a lo largo del genoma para ver cuáles están vinculadas a ciertos rasgos o enfermedades. Tradicionalmente, el GWAS se enfoca en una variante a la vez. Aunque este método puede encontrar variantes genéticas comunes que tienen un fuerte efecto en los rasgos, no es muy adecuado para situaciones más complicadas donde pueden estar involucradas múltiples variantes.
El Problema con el GWAS de Un Solo Locus
En el GWAS de un solo locus, los investigadores asumen que la presencia de otras variantes no influye en la asociación entre una variante genética y un rasgo. Esto funciona bien para variantes comunes con grandes efectos. Sin embargo, en realidad, muchos rasgos son afectados por múltiples variantes genéticas. Cuando los investigadores intentan analizar estos rasgos complejos usando modelos de un solo locus, a menudo se pierden información importante y pueden identificar erróneamente variantes no causales como significativas.
Este problema se ve a menudo en plantas. Por ejemplo, un gen en el sorgo que controla la ruptura de semillas fue originalmente estudiado usando un método de mapeo por ligamiento tradicional. Aunque las mutaciones relevantes no fueron captadas en el GWAS estándar, variantes no funcionales que estaban estrechamente vinculadas a esas mutaciones ganaron importancia debido a sus conexiones con otras variantes causales.
La Necesidad de un Nuevo Enfoque
Hay menos evidencia de este problema en genética humana, pero aún hay ejemplos donde ocurre una situación similar. Ha habido un debate sobre si las asociaciones sintéticas importan en el GWAS humano, especialmente a la luz de estudios más grandes que han identificado múltiples variantes causales para ciertos rasgos.
Para abordar estas preocupaciones, los investigadores desarrollaron un nuevo método llamado GARField. Este método busca encontrar combinaciones de variantes genéticas que afectan en conjunto los rasgos. En lugar de enfocarse en una variante a la vez, GARFIELD busca interacciones entre múltiples variantes, lo que puede dar una imagen más completa de cómo la genética influye en los rasgos.
Cómo Funciona GARFIELD
La idea básica detrás de GARFIELD es crear un "pseudo-genotipo" que refleje los efectos combinados de dos o más mutaciones. De esta manera, el análisis puede capturar los roles complejos que juegan múltiples variantes en la determinación de un rasgo. Los investigadores utilizan un método conocido como bosques aleatorios para identificar qué variantes interactúan entre sí. Este enfoque es computacionalmente eficiente y ayuda a identificar variantes causales reales incluso cuando se trata de antecedentes genéticos complejos.
Usando expresiones de compuertas lógicas, GARFIELD simplifica la interpretación de los resultados. Cuando se aplica a rasgos continuos, utiliza agrupamiento para identificar grupos que luego pueden ser estudiados como pseudo-genotipos binarios.
Beneficios de GARFIELD en Estudios de Plantas
Los investigadores primero probaron la efectividad de GARFIELD en estudios publicados sobre plantas. Descubrieron que buscar heterogeneidad genética-cómo diferentes variantes genéticas contribuyen a rasgos-podría aumentar el poder del GWAS. Por ejemplo, al reanalizar los datos del sorgo sobre la ruptura de semillas, GARFIELD pudo identificar dos mutaciones independientes asociadas con el rasgo, que el GWAS estándar había pasado por alto.
También examinaron la composición de aceite de grano en maíz. Mientras que análisis previos de una sola variante encontraron 26 loci asociados con este rasgo, GARFIELD identificó dos más. Una de estas era un gen conocido involucrado en la síntesis de ácidos grasos, demostrando cómo GARFIELD podía revelar variantes funcionales adicionales.
Investigando Interacciones Genéticas
Los investigadores exploraron el potencial de GARFIELD para descubrir interacciones entre genes. Hicieron esto utilizando datos de expresión génica, donde encontraron que una parte significativa de la heterogeneidad alélica fue pasada por alto en análisis de una sola variante. Muchos genes que no mostraron asociaciones significativas en métodos estándar tenían relaciones importantes cuando se analizaron usando GARFIELD.
De esta manera, pudieron revelar interacciones genéticas que no eran evidentes en análisis de un solo locus. Por ejemplo, identificaron variantes en un gen vinculado al peso del grano que trabajaban juntas con otra variante para impactar significativamente en el rasgo.
Explorando Datos Genéticos Humanos
Los investigadores luego cambiaron su enfoque a la genética humana. Enfrentaron un desafío porque los datos individuales de genotipo-fenotipo no suelen estar disponibles públicamente. Para sortear esto, desarrollaron un método para investigar posibles asociaciones sintéticas al observar variantes genéticas cercanas a picos conocidos de GWAS. Evaluaron variantes que no estaban fuertemente correlacionadas con los SNPs pico para encontrar combinaciones que pudieran explicar el fenotipo detrás de la asociación.
Su análisis encontró que alrededor del 3-5% de los resultados de GWAS podrían representar asociaciones sintéticas. Identificaron más de 45,000 picos que podrían ser reexaminados para posibles relaciones causales ocultas.
Ejemplos Prácticos de Estudios Humanos
Como ejemplo, estudiaron la asociación entre el comportamiento de fumar y encontraron que variantes que se pensaba influían en el comportamiento estaban en realidad asociadas con otro gen involucrado en la formación de circuitos neuronales. Esto sugirió que las asociaciones iniciales eran engañosas y destacó la importancia de examinar múltiples interacciones genéticas.
Otros ejemplos incluyeron variantes vinculadas a niveles de colesterol y altura, donde los investigadores demostraron que las asociaciones conocidas podrían ser explicadas por interacciones no reconocidas entre variantes. Estos hallazgos indican que muchos resultados de GWAS pueden no representar relaciones causales verdaderas debido a asociaciones sintéticas.
Conclusión
La introducción de GARFIELD representa un avance significativo en la comprensión de rasgos genéticos complejos. Al combinar el poder de los bosques aleatorios con un enfoque en múltiples variantes, este método permite una visión más matizada de las interacciones genéticas. Los hallazgos sugieren que muchos resultados existentes de GWAS pueden no reflejar con precisión relaciones causales y que un enfoque más amplio podría llevar a una mejor comprensión de la genética tanto en plantas como en humanos.
Las implicaciones de estos hallazgos van más allá del laboratorio; allanan el camino para una investigación genética más efectiva y una apreciación más profunda de la intrincada naturaleza de los rasgos genéticos. En el futuro, los investigadores necesitarán perfeccionar métodos como GARFIELD y continuar explorando las complejidades de las interacciones génicas para descubrir los verdaderos mecanismos detrás de los rasgos y enfermedades.
Título: On the contribution of genetic heterogeneity to complex traits
Resumen: Genetic heterogeneity, where different alleles or loci are responsible for similar phenotypes, reduces the power of genome-wide association studies and can cause misleading results. Although many striking examples have been identified, the general importance of genetic heterogeneity for complex traits is unclear. Here, we use a novel interpretative machine-learning approach to look for evidence of genetic heterogeneity in plants and humans. Our approach helps identify new loci/alleles influencing trait variation in several agriculturally important species, and we show that at least 6% of maize eQTL, half of them newly identified, exhibit evidence of allelic heterogeneity. Finally, we search for evidence of synthetic associations in human GWAS data, and find that as many as 3-5% may be affected. Our results highlight the need to take genetic heterogeneity seriously, and provide a simple approach for doing so.
Autores: Hai-Jun Liu, K. Swarts, S. Xu, J. Yan, M. Nordborg
Última actualización: 2024-03-30 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.03.27.586967
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.03.27.586967.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.