Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Genómica

Nuevos métodos para analizar patrones de metilación del ADN

Los investigadores proponen nuevos métodos para mejorar el análisis de la metilación del ADN en varias enfermedades.

― 9 minilectura


Avanzando en el AnálisisAvanzando en el Análisisde la Metilación del ADNde la metilación en enfermedades.Nuevos métodos mejoran la comprensión
Tabla de contenidos

La Metilación del ADN es un proceso que implica añadir una etiqueta química llamada grupo metilo al ADN. Esta etiqueta puede afectar cómo se activan o desactivan los genes, desempeñando un papel clave en el desarrollo y en enfermedades como el Cáncer. Los investigadores estudian la metilación del ADN porque les da una idea de cómo se comportan los genes en diferentes condiciones, incluyendo enfermedades.

Cada año, se realizan muchos estudios para observar patrones de metilación del ADN en varios contextos. Un método popular para estos estudios se llama Infinium arrays. Son preferidos porque son asequibles y fáciles de analizar, a diferencia de métodos más complejos que requieren tecnologías de secuenciación avanzadas. Los arrays de Infinium examinan partes específicas del ADN que son importantes para la regulación de genes, como promotores y potenciadores. Sin embargo, esto puede complicar el análisis porque se utilizan múltiples sondas, o pequeñas piezas de ADN, para mirar un solo gen.

Para dar sentido a los datos de estos arrays, los investigadores a menudo realizan lo que se llama Análisis de Enriquecimiento Funcional. Este análisis les ayuda a entender si ciertos conjuntos de genes se comportan de manera similar bajo condiciones específicas. Hay dos tipos principales de métodos para este análisis: Análisis de sobre-representación (ORA) y puntuación de clase funcional (FCS). ORA compara el número de genes significativos en un conjunto específico con lo que se esperaría por azar, mientras que FCS clasifica los genes según cuánto difieren entre condiciones.

Un método más nuevo, la topología de vías, ofrece un enfoque más detallado pero aún no se ha adoptado ampliamente. Incluso con los métodos existentes, hay desafíos. Por ejemplo, los resultados pueden variar significativamente dependiendo del umbral de significancia utilizado para identificar genes importantes. Otro desafío es que, debido a que se utilizan múltiples sondas para un solo gen, puede llevar a confusión en el análisis.

Necesidad de Métodos de Análisis Mejorados

Hay algunas limitaciones con los métodos de análisis actuales. Muchos de ellos no producen puntajes de enriquecimiento, lo que dificulta interpretar resultados porque estos puntajes dan una idea del tamaño del efecto. Sin estos puntajes, los investigadores solo pueden confiar en la significancia estadística, que podría favorecer conjuntos de genes más grandes con funciones menos específicas.

Para abordar estas limitaciones, los investigadores están buscando desarrollar nuevos métodos para realizar FCS con datos de metilación de Infinium. Proponen dos tipos de enfoques. El primer tipo implica analizar cada sonda por separado y luego resumir esos resultados al nivel del gen. El segundo tipo agrega los resultados de todas las sondas para cada gen antes de realizar un análisis diferencial.

Este estudio tiene como objetivo evaluar estos nuevos métodos utilizando datos simulados y compararlos con los métodos ORA existentes. Los investigadores también examinarán qué tan bien funcionan estos métodos con datos reales de cáncer y explorarán otros ejemplos relacionados con el envejecimiento y las tecnologías reproductivas.

Visión General del Análisis de Enriquecimiento Funcional

El análisis de enriquecimiento funcional es una forma de resumir datos de genes individuales en conjuntos de genes más amplios o vías. En el caso de los datos de metilación de Infinium, este proceso se vuelve más complejo debido a la inclusión de múltiples sondas para cada gen. El análisis tiene que pasar primero de sondas a genes y luego de genes a conjuntos de genes.

Aquí hay algunos enfoques para realizar FCS con datos de metilación de Infinium:

  1. Limma Average t-test (LAT): Realiza análisis diferencial a nivel de sonda y calcula los puntajes promedio para cada gen, que luego se utilizan en una prueba t.

  2. Limma Top t-test (LTT): Similar a LAT, pero selecciona la sonda con el puntaje más alto en lugar de promediar.

  3. Limma Average Wilcox (LAW): Usa la prueba de rangos firmados de Wilcoxon en lugar de la prueba t para analizar el enriquecimiento de conjuntos de genes.

  4. Limma Average Mitch (LAM): Utiliza una prueba específica de ANOVA sobre rangos para análisis de enriquecimiento de genes.

  5. Limma Rank Mitch (LRM): Clasifica sondas y promedia los rangos para cada gen antes de realizar el análisis.

  6. Aggregate Limma t-test (ALT): Promedia los valores de las sondas para cada gen antes de realizar una prueba t.

  7. Aggregate Limma Wilcox (ALW): Similar a ALT, pero usa la prueba de Wilcoxon para el enriquecimiento.

  8. Aggregate Limma Mitch (ALM): Similar a ALW, pero utiliza el paquete Mitch para análisis.

Estos nuevos métodos se compararán con los enfoques estándar de ORA para ver cuáles producen mejores resultados.

Datos de Simulación para Evaluación de Métodos

Para evaluar qué tan bien funcionan estos métodos, los investigadores usarán datos simulados basados en información real de metilación. Reunirán datos de una base de datos pública que contiene perfiles de metilación de ADN de tumores de pulmón y los tejidos normales circundantes.

Para las simulaciones, muestrearán datos al azar y crearán conjuntos de genes aleatorios para evitar superposiciones en datos reales. Compararán la efectividad de los diferentes métodos al mirar cuántas señales verdaderas, falsas o perdidas detectan. Esto ayuda a determinar la precisión y sensibilidad de cada enfoque.

Análisis de Sensibilidad

La sensibilidad de cada método se probará analizando el conjunto de datos completo de tumores de pulmón y tejidos normales adyacentes. Los investigadores realizarán un análisis de enriquecimiento de vías y verificarán cuán consistentes son los hallazgos cuando se usa un tamaño de muestra más pequeño. Esto ayudará a evaluar si los métodos pueden detectar de manera confiable vías importantes incluso con menos puntos de datos.

Conectando la Metilación con la Expresión Génica

Hay un gran interés en cómo la metilación del ADN afecta la expresión génica. Los investigadores también examinarán datos de secuenciación de ARN de los mismos pacientes con cáncer de pulmón para ver cómo los cambios en la metilación se correlacionan con los niveles de expresión génica. Analizarán específicamente las regiones promotoras y las regiones del cuerpo del gen por separado para ver si hay diferencias en cómo la metilación influye en la expresión génica.

Patrones de Metilación en el Envejecimiento

Otra aplicación de los nuevos métodos es observar cómo cambian los patrones de metilación del ADN con la edad. Los investigadores utilizarán datos de dos grandes estudios para ver si pueden identificar vías que se ven consistentemente afectadas por el envejecimiento. Compararán hallazgos de diferentes grupos y buscarán vías que muestren cambios significativos en los niveles de metilación.

Patrones de Metilación en Tecnologías de Reproducción Asistida

Los investigadores también aplicarán los nuevos métodos para estudiar cómo las tecnologías de reproducción asistida (ART) afectan la metilación del ADN. Comparando datos de bebés concebidos de manera natural y aquellos a través de ART, examinarán si hay diferencias significativas en los patrones de metilación. Esta investigación podría ayudar a identificar posibles implicaciones para la salud asociadas con ART.

Examinando Diferencias de Metilación en Estados de Enfermedad

Los métodos también se utilizarán para analizar cómo los patrones de metilación del ADN difieren en relación con varios estados de enfermedad. Los investigadores utilizarán estadísticas resumidas de un estudio amplio que investigó numerosas enfermedades comunes. Evaluarán si ciertas vías muestran patrones de metilación alterados en relación con la prevalencia o incidencia de estas enfermedades.

Resultados de las Evaluaciones de Métodos

Los primeros resultados de las simulaciones indican que los nuevos métodos, en particular LAM, demuestran alta precisión en una variedad de condiciones. Los investigadores descubren que LAM funciona consistentemente mejor que los métodos de análisis estándar, especialmente al examinar conjuntos de genes más grandes. Esto sugiere que LAM es una herramienta altamente efectiva para analizar datos de metilación del ADN.

Al examinar datos de cáncer reales, LAM también muestra superior sensibilidad en comparación con los métodos existentes. Las vías identificadas a través de LAM parecen ser más relevantes y biológicamente significativas en el contexto del cáncer.

Integrando Múltiples Puntos de Datos

La capacidad de combinar datos de metilación con datos de expresión génica es crítica para entender las relaciones complejas en los procesos biológicos. Al analizar ambos tipos de datos juntos, los investigadores pueden interpretar más precisamente los efectos de la metilación en la función génica.

Reflexiones Finales

El trabajo destaca el potencial de nuevos métodos para mejorar significativamente nuestra comprensión de la metilación del ADN y sus implicaciones para las enfermedades. La capacidad de analizar conjuntos de datos más grandes e integrar diferentes tipos de datos biológicos mejora los conocimientos que pueden obtener los investigadores. Estos métodos no solo allanan el camino para un análisis mejorado en estudios existentes, sino que también abren puertas para futuras investigaciones sobre el papel de la metilación del ADN en la salud y la enfermedad.

Al compartir herramientas, conocimientos y hallazgos, la comunidad científica puede avanzar colectivamente en el conocimiento en esta área crítica de la investigación.

Fuente original

Título: Direction-aware functional class scoring enrichment analysis of Infinium DNA methylation data

Resumen: Infinium Methylation BeadChip arrays remain one of the most popular platforms for epigenome-wide association studies, but tools for downstream pathway analysis have their limitations. Functional class scoring (FCS) is a group of pathway enrichment techniques that involve the ranking of genes and evaluation of their collective regulation in biological systems, but the implementations described for Infinium methylation array data do not retain direction information, which is important for mechanistic understanding of genomic regulation. Here, we evaluate several candidate FCS methods that retain directional information. According to simulation results, the best-performing method involves the mean aggregation of probe limma t-statistics by gene followed by a rank-ANOVA enrichment test using the mitch package. This method, which we call "LAM", outperformed an existing over-representation analysis method in simulations, and showed higher sensitivity and robustness in an analysis of real lung tumour-normal paired datasets. Using matched RNA-seq data we examine the relationship of methylation differences at promoters and gene bodies with RNA expression at the level of pathways in lung cancer. To demonstrate the utility of our approach, we apply it to three other contexts where public data were available. Firstly, we examine differential pathway methylation associated with chronological age. Secondly, we investigate pathway methylation differences in infants conceived with in vitro fertilisation. Lastly, we analyse differential pathway methylation in 19 disease states, identifying hundreds of novel associations. These results show LAM is a powerful method for the detection of differential pathway methylation as compared to existing methods. A reproducible vignette is provided to illustrate how to implement this method.

Autores: Mark Ziemann, M. Abeysooriya, A. Bora, S. Lamon, M. S. Kasu, M. W. Norris, Y. T. Wong, J. M. Craig

Última actualización: 2024-02-24 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.22.581670

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.22.581670.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares