Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Genómica

Nuevas perspectivas sobre el TEA a través de variantes no codificantes

La investigación explora variantes genéticas no codificantes relacionadas con el trastorno del espectro autista.

― 8 minilectura


ASD y Variantes GenéticasASD y Variantes GenéticasExaminadasvariantes no codificantes y el autismo.Un estudio revela conexiones entre
Tabla de contenidos

La secuenciación de genoma completo (WGS) es una forma de ver todos los genes en el ADN de una persona. Recientemente, los científicos han empezado a usar WGS para estudiar cómo ciertos cambios raros en el ADN, especialmente aquellos que no alteran las proteínas que producen los genes, se relacionan con rasgos complejos en las personas. Un rasgo complejo de interés es el trastorno del espectro autista (TEA), que es una condición del desarrollo que afecta la comunicación y el comportamiento.

Antecedentes sobre Estudios Genéticos y TEA

En el pasado, los investigadores usaron conjuntos más pequeños de información genética, como arrays o secuenciación de exomas, para encontrar conexiones entre cambios genéticos comunes o raros que podrían estar vinculados al TEA. Sin embargo, estos métodos no permitieron investigar a fondo cómo los cambios raros en regiones no codificantes del ADN podrían influir en el TEA.

Un grupo importante de datos al que han recurrido los investigadores es el de la Simons Simplex Collection (SSC). Este conjunto de datos incluye información de WGS de muchas familias con al menos un hijo con TEA. Los investigadores están particularmente interesados en observar variantes "de novo", que son cambios genéticos que son nuevos en el niño y no se heredan de los padres. Estas variantes pueden ser significativas porque tienen menos probabilidades de haber sido influenciadas por selección natural, permitiendo a los investigadores enfocarse en los cambios potencialmente impactantes.

Desafíos en el Análisis de Variantes No Codificantes

A pesar de tener acceso a estos datos valiosos, analizar la relación entre las variantes no codificantes y el TEA presenta desafíos. En los primeros estudios sobre los datos de la SSC, se probaron muchos métodos para encontrar asociaciones entre estas variantes y el TEA, pero ninguno mostró conexiones fuertes tras corregir por múltiples pruebas. Sin embargo, un análisis sí encontró algunas asociaciones usando un método de puntuación de riesgo, que apuntó a conexiones entre variantes y las regiones del ADN que regulan las actividades génicas.

Para entender mejor las contribuciones de las variantes no codificantes de novo al TEA, los investigadores desarrollaron un puntaje de impacto en la enfermedad (DIS) basado en características como la accesibilidad de la cromatina y la unión de proteínas que ayudan a controlar la actividad génica. Entrenaron redes neuronales para predecir estas características basadas en las secuencias de ADN. Combinando estas predicciones, crearon puntajes para evaluar la importancia de variantes específicas.

Necesidad de Métodos Más Simples

El enfoque que usa redes neuronales, aunque poderoso, es complejo y difícil de interpretar. Esto llevó a los investigadores a buscar métodos más simples para ver si podían encontrar señales similares o incluso más fuertes sin la carga computacional pesada. Hallazgos tempranos sugirieron que observar el contenido local de GC-esencialmente la cantidad de ciertas bases de ADN (G y C) en la secuencia de ADN-podría ser suficiente para identificar asociaciones similares.

Encontrando Perspectivas con el Contenido Local de GC

Investigaciones iniciales mostraron un fuerte vínculo entre el contenido local de GC y los puntajes DIS. Esto llevó a los investigadores a considerar si usar solo el contenido local de GC podría producir resultados de asociación similares. Compararon grupos de variantes basados en el contenido local de GC y utilizaron variantes genómicas establecidas para probar estas asociaciones.

Cuando realizaron estas comparaciones, encontraron que el contenido local de GC podría explicar muchas de las asociaciones previamente atribuidas a modelos más complejos. Sin embargo, también reconocieron que aunque el contenido local de GC podría captar señales significativas, no descartaba la posibilidad de que otras características únicas de la secuencia también pudieran ser importantes.

Investigando Factores Específicos

Dado que el TEA afecta predominantemente a los hombres, los investigadores examinaron cómo las diferencias de sexo entre los probandos (individuos con TEA) y sus hermanos podrían influir en el contenido local de GC de las variantes genéticas. Descubrieron que las señales más fuertes provenían de familias donde el probando era masculino y el hermano era femenino. Esto sugirió una relación más matizada donde las variantes cerca de ciertos genes podrían contribuir de manera diferente según el sexo del probando y del hermano.

A la luz de estos hallazgos, los investigadores crearon un nuevo método analítico llamado Estudio de Asociación de Secuencias de Vecindario de Expresión (ENSAS). Este enfoque permite un análisis más completo al observar no solo el contenido local de GC, sino también secuencias específicas alrededor de los genes vinculados a patrones de expresión génica.

Marco y Análisis de ENSAS

ENSAS fue diseñado para definir sistemáticamente los vecindarios de expresión génica. Para cada gen, identifica genes cercanos basándose en sus patrones de expresión e incluye variantes de estos genes en su análisis. Al enfocarse en estos vecindarios, ENSAS puede encontrar asociaciones que podrían perderse al observar genes o variantes individuales por separado.

Cuando los investigadores aplicaron ENSAS a los datos de la SSC, se centraron específicamente en las variantes de probandos masculinos y hermanas femeninas ubicadas río arriba de sus genes asignados. Este enfoque específico mejoró la capacidad de identificar diferencias en el contenido local de GC que estaban significativamente vinculadas al TEA.

Resultados del Análisis de ENSAS

Usando ENSAS, los investigadores descubrieron varios vecindarios con diferencias significativas en el contenido local de GC entre variantes de probandos y hermanos. Los vecindarios principales estaban enriquecidos para genes asociados con funciones sinápticas, lo que sugiere que estos cambios genéticos podrían estar vinculados a procesos biológicos clave involucrados en el TEA.

Análisis adicionales que observaban estados de cromatina-esencialmente cuán accesible o cerrado está el ADN en diferentes tejidos-ayudaron a explicar algunas de las diferencias en el contenido local de GC observadas. Los resultados indicaron que ciertos estados de cromatina eran más prevalentes entre variantes de probandos, sugiriendo una base biológica para las diferencias en el contenido local de GC.

Explorando la Especificidad de la Señal de Asociación

Para asegurarse de que las señales detectadas no estaban relacionadas meramente con problemas técnicos en la secuenciación, los investigadores compararon segmentos de datos de individuos cuyos muestras fueron procesadas en los mismos carriles de secuenciación. Este análisis reveló que las asociaciones significativas persistieron incluso entre muestras de carriles coincidentes, indicando que las señales observadas probablemente no fueron impulsadas por efectos de lote de secuenciación.

La especificidad de las señales se probó aún más aplicando el marco ENSAS a otros grupos, como probandos masculinos con hermanos masculinos y probandos femeninos con hermanos masculinos o femeninos. Estos análisis revelaron que las asociaciones más fuertes eran únicas para el grupo de probando masculino-hermana femenina.

Perspectivas de Otros Conjuntos de Datos

Finalmente, los investigadores buscaron validar sus hallazgos aplicando ENSAS a un conjunto de datos independiente derivado de una población en Islandia. Este conjunto de datos también contenía información de tríos (padres e hijos) que permitían análisis similares. Sin embargo, al aplicar la misma metodología, los investigadores no encontraron asociaciones significativas en los datos islandeses, lo que sugiere que las señales identificadas en el conjunto de datos de SSC podrían ser específicas para el fenotipo de TEA.

Conclusión y Direcciones Futuras

En general, el estudio refuerza la idea de que las variantes genéticas no codificantes juegan un papel crucial en entender rasgos complejos como el TEA. Al emplear tanto métodos analíticos tradicionales como nuevos, los investigadores pueden obtener ideas sobre los fundamentos genéticos del TEA y potencialmente de otras condiciones psicológicas. Los hallazgos no solo iluminan la importancia de las variantes no codificantes raras, sino que también destacan el valor de simplificar los enfoques analíticos para hacer los hallazgos más claros y más interpretables.

A medida que los datos de WGS continúan creciendo y más poblaciones son estudiadas, será esencial construir sobre estos métodos y explorar más cómo las diferencias genéticas se relacionan con rasgos complejos en grupos diversos. La investigación futura también podría investigar los mecanismos biológicos detrás de las asociaciones genéticas observadas y cómo se traducen en los comportamientos y síntomas asociados con el TEA.

Fuente original

Título: Identifying associations of de novo noncoding variants with autism through integration of gene expression, sequence and sex information

Resumen: Whole-genome sequencing (WGS) data is facilitating genome-wide identification of rare noncoding variants, while elucidating their roles in disease remains challenging. Towards this end, we first revisit a reported significant brain-related association signal of autism spectrum disorder (ASD) detected from de novo noncoding variants attributed to deep-learning and show that local GC content can capture similar association signals. We further show that the association signal appears driven by variants from male proband-female sibling pairs that are upstream of assigned genes. We then develop Expression Neighborhood Sequence Association Study (ENSAS), which utilizes gene expression correlations and sequence information, to more systematically identify phenotype-associated variant sets. Applying ENSAS to the same set of de novo variants, we identify gene expression-based neighborhoods showing significant ASD association signal, enriched for synapse-related gene ontology terms. For these top neighborhoods, we also identify chromatin states annotations of variants that are predictive of the proband-sibling local GC content differences. Our work provides new insights into associations of non-coding de novo mutations in ASD and presents an analytical framework applicable to other phenotypes.

Autores: Jason Ernst, R. Li

Última actualización: 2024-03-21 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.03.20.585624

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.03.20.585624.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares