Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

Linkage: Uno Strumento per l'Analisi della Regolazione Genica

Il linkage semplifica gli studi sulla regolazione genica integrando dati di cromatina e espressione genica.

― 6 leggere min


Trasformazioni diTrasformazioni dicollegamento perl'analisi genicasulla regolazione genica.Uno strumento potente per intuizioni
Indice

Con la crescita delle nuove tecnologie nel sequenziamento del DNA, gli scienziati stanno scoprendo sempre di più sulle regioni non codificanti del genoma, che giocano un ruolo chiave in come i geni sono regolati. Queste regioni non codificanti hanno molti elementi che aiutano a controllare i geni, compresi i punti dove le proteine chiamate fattori di trascrizione possono legarsi. Comprendere come queste regioni interagiscono con i geni che regolano è importante per studiare processi biologici e malattie.

Accessibilità della cromatina

Uno dei concetti importanti in questo ambito è l'accessibilità della cromatina. Questo termine si riferisce a quanto siano accessibili certi pezzi del nostro DNA per le proteine che devono legarsi a essi. Quando parti di DNA sono aperte e accessibili, le proteine possono attaccarsi facilmente, influenzando l'attività genica. Gli scienziati studiano l'accessibilità della cromatina usando tecniche come l'ATAC-seq, che aiuta a mappare queste aree aperte in tutto il genoma.

Sequenziamento RNA

Un'altra tecnica comune è il sequenziamento RNA (RNA-seq). Questo metodo misura il livello di espressione genica, mostrando quanto di ogni gene sia attivo in un campione. L'RNA-seq gioca un ruolo vitale nella comprensione delle malattie, nella classificazione dei tipi di cancro, nella diagnosi delle condizioni e nella ricerca dei migliori trattamenti.

Integrazione dei Dati

I ricercatori hanno iniziato a combinare i dati provenienti dall'accessibilità della cromatina (da ATAC-seq) e dall'espressione genica (da RNA-seq) per capire meglio come i geni sono regolati. Tuttavia, questo lavoro può essere difficile, specialmente per chi non è esperto nell'analizzare set di dati così complessi. Molti strumenti disponibili permettono principalmente di analizzare set di dati pubblici, che potrebbero non soddisfare sempre le esigenze di ricerca individuali.

Applicazione Linkage

Per affrontare queste sfide, è stata sviluppata una nuova applicazione user-friendly chiamata Linkage. Questo strumento online consente agli utenti di esaminare e visualizzare potenziali elementi regolatori genici integrando i dati di ATAC-seq e RNA-seq. Linkage permette agli utenti di caricare i propri dati o ri-analizzare set di dati pubblicamente disponibili per identificare elementi regolatori in tutto il genoma.

Caratteristiche Principali di Linkage

Modulo Home

Il Modulo Home di Linkage funge da introduzione e offre un'interfaccia semplice per gli utenti per importare i propri dati. Offre due set di dati pubblici per l'analisi, uno relativo al cancro al seno e l'altro alle cellule staminali muscolari dei topi. Gli utenti possono anche caricare i propri file dati in un formato specifico, rendendo lo strumento accessibile per una varietà di scenari di ricerca.

Modulo Ricerca Picchi Regolatori

Il Modulo Ricerca Picchi Regolatori è la funzione principale di Linkage. Aiuta gli utenti a trovare tutte le possibili regioni di DNA regolatorie collegate a un gene specifico. Il modulo esegue automaticamente analisi statistiche per correlare l'accessibilità della cromatina con l'espressione genica tra i campioni. Gli utenti possono personalizzare le proprie analisi selezionando diverse regioni di interesse e metodi di correlazione. I risultati, che mostrano le potenziali regioni regolatorie, possono essere visualizzati in grafici a dispersione per rivelare le relazioni tra l'accessibilità del DNA e l'attività genica.

Modulo Visualizzazione Picchi Regolatori

Una volta identificati i potenziali picchi regolatori, gli utenti possono visualizzare come le letture di ATAC-seq coprono queste regioni e come questo si relaziona all'espressione genica. Linkage raggruppa i campioni in base ai livelli di accessibilità della cromatina, consentendo agli utenti di esaminare la copertura delle letture di ATAC-seq insieme a boxplot che mostrano i livelli di espressione per il gene target in ciascun gruppo.

Modulo Annotazione Picchi Regolatori

Il passo successivo è annotare i picchi regolatori previsti. Gli utenti possono visualizzare le caratteristiche di questi picchi, come la loro posizione rispetto ai geni. Questo modulo fornisce informazioni su se i picchi ricadono in aree genomicamente importanti, come i siti di inizio trascrizione o gli esoni genici. Una visualizzazione chiamata upset plot aiuta gli utenti a comprendere le sovrapposizioni e la distribuzione di questi picchi regolatori.

Modulo Rilevamento Elementi Cis-Regolatori

Il Modulo Rilevamento Elementi Cis-Regolatori consente ai ricercatori di identificare specifici elementi di DNA che influenzano la regolazione genica. Esaminando i siti di legame dei fattori di trascrizione (TFBS) all'interno dei picchi regolatori, gli utenti possono vedere dove questi fattori possono interagire con il DNA. Lo strumento fornisce informazioni sulla posizione e sul punteggio di legame per TFBS arricchiti e visualizza questi dati utilizzando loghi di sequenza.

Modulo Rete Regolatoria Genica

Capire come diversi elementi regolatori e geni interagiscono è essenziale. Il Modulo Rete Regolatoria Genica consente agli utenti di creare reti visive che mostrano questa interazione. Gli utenti possono inserire elenchi di geni e regolare vari parametri per costruire la rete. Questo modulo utilizza analisi precedenti per costruire reti informative e interattive che possono essere personalizzate e salvate per un uso futuro.

Modulo Analisi Arricchimento Percorsi

Il Modulo Analisi Arricchimento Percorsi aiuta a collegare i geni identificati a percorsi biologici. Gli utenti possono inserire elenchi di geni per vedere come si relazionano ai percorsi molecolari e alle categorie funzionali come gene ontology (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG). Questa analisi può rivelare le funzioni sottostanti e i ruoli dei geni in vari contesti biologici.

Studio di Caso

Per illustrare come funziona Linkage, consideriamo uno studio di caso che coinvolge il cancro al seno e le cellule staminali muscolari dei topi. I ricercatori hanno raccolto campioni da entrambi i gruppi che avevano dati abbinati su accessibilità della cromatina e espressione genica. Usando Linkage, hanno analizzato quali regioni regolatorie potrebbero influenzare l'espressione genica nel cancro al seno.

Questa analisi ha coperto migliaia di geni espressi e, utilizzando criteri rigorosi, i ricercatori hanno identificato molte regioni regolatorie associate a questi geni. Un'analisi simile nei campioni di topo ha prodotto un elenco di regioni regolatorie per diverse centinaia di geni. Questi risultati evidenziano come Linkage possa rivelare efficacemente gli elementi che regolano i geni da dati complessi.

Conclusione

Linkage è un'applicazione web versatile progettata per i ricercatori che cercano di analizzare dati multi-omics su larga scala. Permette di identificare facilmente gli elementi regolatori del DNA in tutto il genoma integrando dati di accessibilità della cromatina e di espressione genica. L'applicazione offre strumenti user-friendly per la visualizzazione, l'annotazione e l'analisi delle reti, rendendola accessibile anche per chi ha una formazione limitata in bioinformatica. Per chi ha più esperienza, sono disponibili parametri personalizzabili per migliorare il processo analitico. Con i progressi nelle tecnologie di sequenziamento e l'interesse crescente nell'analisi integrativa dei multi-omics, strumenti come Linkage saranno cruciali per i ricercatori che studiano sistemi biologici complessi. Lo sviluppo di Linkage promette di supportare la comunità di ricerca nella comprensione della regolazione genica e delle sue implicazioni per la salute e la malattia.

Fonte originale

Titolo: Linkage: an interactive shiny app and R package for linking of DNA regulatory peaks to genes

Estratto: SummaryExisting studies have demonstrated that the integration analysis of transcriptomic and epigenomic data can be used to better understand the onset and progression of many diseases, as well as identify new diagnostic and prognostic biomarkers. However, such investigations on large-scale sequencing data remain challenging for researchers or clinicians with limited bioinformatics knowledge. To facilitate the interpretation of gene regulatory landscape, we developed an R Shiny application and R package [Linking of atac-seq to gene expression data (Linkage)] for exploring and visualizing potential cis-regulatory elements (CREs) of genes based on ATAC-seq and RNA-seq data. Linkage offers six modules to systematically identify, annotate, and interpret potential gene regulatory elements from the whole genome step by step. Linkage can provide interactive visualization for the correlation between chromatin accessibility and gene expression. More than that, Linkage identifies transcription factors (TFs) that potentially drive the chromatin changes through identifying TF binding motifs within the CREs and constructing trans-regulatory networks of the target gene set. This powerful tool enables researchers to conduct extensive multiomics integration analysis and generate visually appealing visualizations that effectively highlight the relationship between genes and corresponding regulatory elements. With Linkage, users can obtain publishable results and gain deeper insights into the gene regulatory landscape. Availability and implementation Linkage is freely available as a Shiny web application (https://xulabgdpu.org.cn/linkage) and an R package (https://github.com/XuLab-GDPU/Linkage). The documentation is available at (https://aicplane.github.io/Linkage-tutorial/).

Autori: Siwen Xu, Z. Liu, S. Chen, T. Li, C. Zhang, Y. Luo, J. Zheng, Z. Lu, J. Yang

Ultimo aggiornamento: 2024-04-28 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.04.24.590756

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.24.590756.full.pdf

Licenza: https://creativecommons.org/licenses/by-nc/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili