Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Vínculo: Una herramienta para el análisis de regulación genética

La vinculación simplifica los estudios de regulación genética al integrar datos de cromatina y expresión génica.

― 7 minilectura


Transformaciones deTransformaciones deVínculo en AnálisisGenéticogenética.información sobre la regulaciónUna herramienta potente para obtener
Tabla de contenidos

Con el crecimiento de nuevas tecnologías en secuenciación de ADN, los científicos están aprendiendo más sobre las regiones no codificantes del genoma, que juegan un papel clave en cómo se regulan los genes. Estas regiones no codificantes tienen muchos elementos que ayudan a controlar los genes, incluidos los lugares donde proteínas llamadas factores de transcripción pueden unirse. Entender cómo estas regiones interactúan con los genes que regulan es importante para estudiar procesos biológicos y enfermedades.

Accesibilidad de la cromatina

Un concepto importante en esta área es la accesibilidad de la cromatina. Este término se refiere a cuán accesibles son ciertas partes de nuestro ADN para las proteínas que necesitan unirse a ellas. Cuando partes del ADN están abiertas y accesibles, las proteínas pueden unirse fácilmente, afectando la actividad del gen. Los científicos estudian la accesibilidad de la cromatina usando técnicas como ATAC-seq, que ayuda a mapear estas áreas abiertas en todo el genoma.

Secuenciación de ARN

Otra técnica común es la secuenciación de ARN (RNA-seq). Este método mide el nivel de expresión génica, mostrando cuántos de cada gen están activos en una muestra. RNA-seq juega un papel vital en entender enfermedades, clasificar tipos de cáncer, diagnosticar condiciones y encontrar los mejores tratamientos.

Integración de Datos

Los investigadores han comenzado a combinar datos de accesibilidad de la cromatina (de ATAC-seq) y expresión génica (de RNA-seq) para entender mejor cómo se regulan los genes. Sin embargo, este trabajo puede ser difícil, especialmente para aquellos que no están familiarizados con el análisis de conjuntos de datos tan complejos. La mayoría de las herramientas disponibles permiten a los usuarios analizar conjuntos de datos públicos, que pueden no adaptarse siempre a las necesidades individuales de investigación.

Aplicación Linkage

Para abordar estos desafíos, se ha desarrollado una nueva aplicación fácil de usar llamada Linkage. Esta herramienta en línea permite a los usuarios examinar y visualizar elementos potenciales de regulación génica integrando datos de ATAC-seq y RNA-seq. Linkage permite a los usuarios subir sus propios datos o reanalizar conjuntos de datos disponibles públicamente para identificar elementos regulatorios en todo el genoma.

Características Principales de Linkage

Módulo de Inicio

El Módulo de Inicio de Linkage sirve como una introducción y ofrece una interfaz sencilla para que los usuarios importen sus datos. Ofrece dos conjuntos de datos públicos para análisis, uno relacionado con el cáncer de mama y el otro con células madre musculares de ratón. Los usuarios también pueden subir sus propios archivos de datos en un formato específico, haciendo que la herramienta sea accesible para una variedad de escenarios de investigación.

Módulo de Búsqueda de Picos Regulatorios

El Módulo de Búsqueda de Picos Regulatorios es la característica principal de Linkage. Ayuda a los usuarios a encontrar todas las posibles regiones de ADN regulatorias conectadas a un gen específico. El módulo realiza automáticamente análisis estadístico para correlacionar la accesibilidad de la cromatina con la expresión génica a través de muestras. Los usuarios pueden personalizar sus análisis seleccionando diferentes regiones de interés y métodos de correlación. Los resultados, que muestran las posibles regiones regulatorias, pueden visualizarse en gráficos de dispersión para revelar las relaciones entre la accesibilidad del ADN y la actividad del gen.

Módulo de Visualización de Picos Regulatorios

Una vez identificados los picos regulatorios potenciales, los usuarios pueden visualizar cómo las lecturas de ATAC-seq cubren estas regiones y cómo esto se relaciona con la expresión génica. Linkage agrupa muestras según los niveles de accesibilidad de la cromatina, permitiendo a los usuarios examinar la cobertura de las lecturas de ATAC-seq junto con gráficos de caja que muestran los niveles de expresión del gen objetivo en cada grupo.

Módulo de Anotación de Picos Regulatorios

El siguiente paso es anotar los picos regulatorios predichos. Los usuarios pueden visualizar características de estos picos, como su ubicación en relación con los genes. Este módulo proporciona información sobre si los picos caen dentro de áreas genómicas importantes, como sitios de inicio de transcripción o exones de genes. Una visualización llamada gráfico upset ayuda a los usuarios a comprender las superposiciones y la distribución de estos picos regulatorios.

Módulo de Detección de Elementos Cis-Regulatorios

El Módulo de Detección de Elementos Cis-Regulatorios permite a los investigadores identificar elementos específicos de ADN que influyen en la regulación génica. Al examinar los sitios de unión de factores de transcripción (TFBS) dentro de los picos regulatorios, los usuarios pueden ver dónde estos factores pueden interactuar con el ADN. La herramienta proporciona información de ubicación y puntaje de unión para los TFBS enriquecidos y visualiza estos datos usando logotipos de secuencia.

Módulo de Red Regulatoria Génica

Entender cómo interactúan diferentes elementos regulatorios y genes es esencial. El Módulo de Red Regulatoria Génica permite a los usuarios crear redes visuales que muestran esta interacción. Los usuarios pueden introducir listas de genes y ajustar varios parámetros para construir la red. Este módulo utiliza análisis previos para construir redes informativas e interactivas que pueden ser personalizadas y guardadas para un uso futuro.

Módulo de Análisis de Enriquecimiento de Vías

El Módulo de Análisis de Enriquecimiento de Vías ayuda a vincular genes identificados con vías biológicas. Los usuarios pueden introducir listas de genes para ver cómo se relacionan con vías moleculares y categorías funcionales como ontología de genes (GO) y la Enciclopedia de Genes y Genomas de Kioto (KEGG). Este análisis puede revelar las funciones subyacentes y roles de los genes en varios contextos biológicos.

Estudio de Caso

Para ilustrar cómo funciona Linkage, consideremos un estudio de caso que involucra el cáncer de mama y células madre musculares de ratón. Los investigadores recogieron muestras de ambos grupos que tenían datos emparejados sobre accesibilidad de la cromatina y expresión génica. Al usar Linkage, analizaron qué regiones regulatorias podrían influir en la expresión génica en el cáncer de mama.

Este análisis cubrió miles de genes expresados, y usando criterios estrictos, los investigadores identificaron muchas regiones regulatorias asociadas con estos genes. Un análisis similar en muestras de ratón produjo una lista de regiones regulatorias para varios cientos de genes. Estos hallazgos resaltan cómo Linkage puede revelar de manera efectiva elementos que regulan genes a partir de datos complejos.

Conclusión

Linkage es una aplicación web versátil diseñada para investigadores que buscan analizar datos multiómicos a gran escala. Permite la identificación fácil de elementos regulatorios de ADN en todo el genoma al integrar datos de accesibilidad de la cromatina y expresión génica. La aplicación proporciona herramientas fáciles de usar para visualización, anotación y análisis de redes, haciéndola accesible incluso para aquellos con un conocimiento limitado en bioinformática. Para aquellos con más experiencia, hay parámetros personalizables disponibles para mejorar el proceso analítico. Con los avances en tecnologías de secuenciación y el creciente interés en el análisis integrador de múltiples ómicas, herramientas como Linkage serán cruciales para los investigadores que estudian sistemas biológicos complejos. El desarrollo de Linkage promete apoyar a la comunidad investigadora en la comprensión de la regulación génica y sus implicaciones para la salud y la enfermedad.

Fuente original

Título: Linkage: an interactive shiny app and R package for linking of DNA regulatory peaks to genes

Resumen: SummaryExisting studies have demonstrated that the integration analysis of transcriptomic and epigenomic data can be used to better understand the onset and progression of many diseases, as well as identify new diagnostic and prognostic biomarkers. However, such investigations on large-scale sequencing data remain challenging for researchers or clinicians with limited bioinformatics knowledge. To facilitate the interpretation of gene regulatory landscape, we developed an R Shiny application and R package [Linking of atac-seq to gene expression data (Linkage)] for exploring and visualizing potential cis-regulatory elements (CREs) of genes based on ATAC-seq and RNA-seq data. Linkage offers six modules to systematically identify, annotate, and interpret potential gene regulatory elements from the whole genome step by step. Linkage can provide interactive visualization for the correlation between chromatin accessibility and gene expression. More than that, Linkage identifies transcription factors (TFs) that potentially drive the chromatin changes through identifying TF binding motifs within the CREs and constructing trans-regulatory networks of the target gene set. This powerful tool enables researchers to conduct extensive multiomics integration analysis and generate visually appealing visualizations that effectively highlight the relationship between genes and corresponding regulatory elements. With Linkage, users can obtain publishable results and gain deeper insights into the gene regulatory landscape. Availability and implementation Linkage is freely available as a Shiny web application (https://xulabgdpu.org.cn/linkage) and an R package (https://github.com/XuLab-GDPU/Linkage). The documentation is available at (https://aicplane.github.io/Linkage-tutorial/).

Autores: Siwen Xu, Z. Liu, S. Chen, T. Li, C. Zhang, Y. Luo, J. Zheng, Z. Lu, J. Yang

Última actualización: 2024-04-28 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.04.24.590756

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.04.24.590756.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares

Medicina Genética y GenómicaClasificación errónea de la diabetes: Un riesgo oculto para los británicos del sur de Asia

Un estudio revela la mala clasificación de la diabetes en los asiáticos del sur de Gran Bretaña, poniendo en riesgo la atención al paciente.

― 6 minilectura