Simple Science

La science de pointe expliquée simplement

# Biologie# Bioinformatique

Lien : Un Outil pour l'Analyse de la Régulation Génétique

Le linkage simplifie les études sur la régulation des gènes en intégrant des données sur la chromatine et l'expression des gènes.

― 7 min lire


Transformations deTransformations deliaison pour l'analysedes gènesrégulation des gènes.Un outil puissant pour des infos sur la
Table des matières

Avec la montée des nouvelles technologies de séquençage ADN, les scientifiques découvrent plein de trucs sur les régions non codantes du génome, qui jouent un rôle clé dans la régulation des gènes. Ces régions non codantes ont plein d'éléments qui aident à contrôler les gènes, y compris des endroits où des protéines appelées facteurs de transcription peuvent se fixer. Comprendre comment ces régions interagissent avec les gènes qu'elles régulent est super important pour étudier les processus biologiques et les maladies.

Accessibilité de la chromatine

Un concept important dans ce domaine est l'accessibilité de la chromatine. Ce terme fait référence à la façon dont certaines parties de notre ADN sont accessibles aux protéines qui doivent s'y lier. Quand des bouts d'ADN sont ouverts et accessibles, les protéines peuvent facilement s'attacher, ce qui affecte l'activité des gènes. Les scientifiques étudient l'accessibilité de la chromatine à l'aide de techniques comme l'ATAC-seq, qui aide à cartographier ces zones ouvertes dans tout le génome.

Séquençage d'ARN

Une autre technique courante est le séquençage d'ARN (RNA-seq). Cette méthode mesure le niveau d'expression des gènes, montrant combien de chaque gène est actif dans un échantillon. Le RNA-seq joue un rôle essentiel dans la compréhension des maladies, la classification des types de cancer, le diagnostic des conditions et la recherche des meilleurs traitements.

Intégration des données

Les chercheurs ont commencé à combiner les données de l'accessibilité de la chromatine (de l'ATAC-seq) et de l'expression des gènes (du RNA-seq) pour mieux comprendre comment les gènes sont régulés. Cependant, ce travail peut être difficile, surtout pour ceux qui ne sont pas familiers avec l'analyse de jeux de données aussi complexes. La plupart des outils disponibles permettent surtout d'analyser des jeux de données publics, qui ne conviennent pas toujours aux besoins de recherche individuels.

Application Linkage

Pour répondre à ces défis, une nouvelle application conviviale appelée Linkage a été développée. Cet outil en ligne permet aux utilisateurs d'examiner et de visualiser les éléments potentiels de régulation des gènes en intégrant les données de l'ATAC-seq et du RNA-seq. Linkage permet aux utilisateurs de télécharger leurs propres données ou de ré-analyser des jeux de données publics pour identifier les éléments régulateurs dans le génome.

Principales fonctionnalités de Linkage

Module d’accueil

Le Module d’accueil de Linkage sert d'introduction et offre une interface simple pour que les utilisateurs importent leurs données. Il propose deux jeux de données publics pour analyse, l'un lié au cancer du sein et l'autre aux cellules souches musculaires de souris. Les utilisateurs peuvent également télécharger leurs propres fichiers de données dans un format spécifique, rendant l'outil accessible pour divers scénarios de recherche.

Module de recherche des pics régulateurs

Le Module de recherche des pics régulateurs est la principale caractéristique de Linkage. Il aide les utilisateurs à trouver toutes les régions d'ADN régulatrices possibles liées à un gène spécifique. Le module effectue automatiquement une analyse statistique pour corréler l'accessibilité de la chromatine avec l'expression des gènes à travers les échantillons. Les utilisateurs peuvent personnaliser leurs analyses en sélectionnant différentes régions d'intérêt et méthodes de corrélation. Les résultats, qui montrent les régions régulatrices potentielles, peuvent être visualisés sous forme de graphiques pour révéler les relations entre l'accessibilité de l'ADN et l'activité des gènes.

Module de visualisation des pics régulateurs

Une fois que les pics régulateurs potentiels sont identifiés, les utilisateurs peuvent visualiser comment les lectures ATAC-seq couvrent ces régions et comment cela se rapporte à l'expression des gènes. Linkage regroupe les échantillons en fonction des niveaux d'accessibilité de la chromatine, permettant aux utilisateurs d'examiner la couverture des lectures ATAC-seq à côté de graphiques montrant les niveaux d'expression pour le gène cible dans chaque groupe.

Module d'annotation des pics régulateurs

L'étape suivante consiste à annoter les pics régulateurs prévus. Les utilisateurs peuvent visualiser les caractéristiques de ces pics, comme leur emplacement par rapport aux gènes. Ce module donne un aperçu de la manière dont les pics se situent dans des zones génomiques importantes, comme les sites de début de transcription ou les exons de gènes. Une visualisation appelée un upset plot aide les utilisateurs à comprendre les chevauchements et la distribution de ces pics régulateurs.

Module de détection des éléments cis-régulateurs

Le Module de détection des éléments cis-régulateurs permet aux chercheurs d'identifier des éléments ADN spécifiques qui influencent la régulation des gènes. En examinant les sites de liaison des facteurs de transcription (TFBS) au sein des pics régulateurs, les utilisateurs peuvent voir où ces facteurs peuvent interagir avec l'ADN. L'outil fournit des informations sur l'emplacement et le score de liaison pour les TFBS enrichis et visualise ces données à l'aide de logos de séquence.

Module du réseau régulateur des gènes

Comprendre comment différents éléments régulateurs et gènes interagissent est essentiel. Le Module du réseau régulateur des gènes permet aux utilisateurs de créer des réseaux visuels montrant cette interaction. Les utilisateurs peuvent entrer des listes de gènes et ajuster divers paramètres pour construire le réseau. Ce module utilise les analyses précédentes pour construire des réseaux informatifs et interactifs qui peuvent être personnalisés et sauvegardés pour une utilisation future.

Module d'analyse d'enrichissement de voie

Le Module d'analyse d'enrichissement de voie aide à lier les gènes identifiés à des voies biologiques. Les utilisateurs peuvent entrer des listes de gènes pour voir comment ils se rapportent aux voies moléculaires et aux catégories fonctionnelles telles que l'ontologie des gènes (GO) et l'Encyclopédie de Kyoto des gènes et des génomes (KEGG). Cette analyse peut révéler les fonctions sous-jacentes et les rôles des gènes dans divers contextes biologiques.

Étude de cas

Pour illustrer comment Linkage fonctionne, prenons une étude de cas impliquant le cancer du sein et les cellules souches musculaires de souris. Des chercheurs ont collecté des échantillons des deux groupes qui avaient des données assorties sur l'accessibilité de la chromatine et l'expression des gènes. En utilisant Linkage, ils ont analysé quelles régions régulatrices pourraient influencer l'expression des gènes dans le cancer du sein.

Cette analyse a couvert des milliers de gènes exprimés, et en utilisant des critères stricts, les chercheurs ont identifié de nombreuses régions régulatrices associées à ces gènes. Une analyse similaire dans des échantillons de souris a produit une liste de régions régulatrices pour plusieurs centaines de gènes. Ces résultats mettent en évidence comment Linkage peut révéler efficacement les éléments régulateurs des gènes à partir de données complexes.

Conclusion

Linkage est une application web polyvalente conçue pour les chercheurs cherchant à analyser des données multi-omiques à grande échelle. Elle permet d'identifier facilement des éléments régulateurs d'ADN dans le génome en intégrant l'accessibilité de la chromatine et les données d'expression des gènes. L'application fournit des outils conviviaux pour la visualisation, l'annotation et l'analyse de réseau, rendant l'outil accessible même pour ceux qui ont peu d'expérience en bioinformatique. Pour ceux qui ont plus d'expérience, des paramètres personnalisables sont disponibles pour améliorer le processus analytique. Avec les avancées dans les technologies de séquençage et l'intérêt croissant pour l'analyse multi-omique intégrative, des outils comme Linkage seront cruciaux pour les chercheurs étudiant des systèmes biologiques complexes. Le développement de Linkage promet de soutenir la communauté de recherche dans la compréhension de la régulation des gènes et de ses implications pour la santé et la maladie.

Source originale

Titre: Linkage: an interactive shiny app and R package for linking of DNA regulatory peaks to genes

Résumé: SummaryExisting studies have demonstrated that the integration analysis of transcriptomic and epigenomic data can be used to better understand the onset and progression of many diseases, as well as identify new diagnostic and prognostic biomarkers. However, such investigations on large-scale sequencing data remain challenging for researchers or clinicians with limited bioinformatics knowledge. To facilitate the interpretation of gene regulatory landscape, we developed an R Shiny application and R package [Linking of atac-seq to gene expression data (Linkage)] for exploring and visualizing potential cis-regulatory elements (CREs) of genes based on ATAC-seq and RNA-seq data. Linkage offers six modules to systematically identify, annotate, and interpret potential gene regulatory elements from the whole genome step by step. Linkage can provide interactive visualization for the correlation between chromatin accessibility and gene expression. More than that, Linkage identifies transcription factors (TFs) that potentially drive the chromatin changes through identifying TF binding motifs within the CREs and constructing trans-regulatory networks of the target gene set. This powerful tool enables researchers to conduct extensive multiomics integration analysis and generate visually appealing visualizations that effectively highlight the relationship between genes and corresponding regulatory elements. With Linkage, users can obtain publishable results and gain deeper insights into the gene regulatory landscape. Availability and implementation Linkage is freely available as a Shiny web application (https://xulabgdpu.org.cn/linkage) and an R package (https://github.com/XuLab-GDPU/Linkage). The documentation is available at (https://aicplane.github.io/Linkage-tutorial/).

Auteurs: Siwen Xu, Z. Liu, S. Chen, T. Li, C. Zhang, Y. Luo, J. Zheng, Z. Lu, J. Yang

Dernière mise à jour: 2024-04-28 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.04.24.590756

Source PDF: https://www.biorxiv.org/content/10.1101/2024.04.24.590756.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires