Nuove scoperte sul decadimento mediato da nonsense nell'espressione genica
Questo studio rivela scoperte chiave sul ruolo dell'NMD nella regolazione dell'espressione genica.
― 6 leggere min
Indice
- Comprendere la Degradazione Mediata da Nonsense (NMD)
- Annotazione dei Geni e NMD
- Studio dell'Espressione Genica nel Contesto NMD
- Sfide nell'Assemblaggio del Trascrittoma
- Identificazione delle Sequenze Codificanti e Stato NMD
- Analisi dell'Espressione di Geni e Trascritti
- Interfaccia Web NMDtxDB
- Direzioni Future e Obiettivi
- Fonte originale
- Link di riferimento
L'Espressione genica è il processo attraverso cui le cellule creano l'mRNA (RNA messaggero) dai geni, che poi funge da guida per la produzione delle proteine. Prima che l'mRNA possa essere utilizzato per la sintesi delle proteine, subisce diverse modifiche per diventare maturo. Queste modifiche includono processi chiamati capping, splicing e poliadenilazione. Una volta che l'mRNA è maturo, si sposta nel citoplasma, dove i ribosomi aiutano a tradurlo in proteine.
Un aspetto importante di questo processo è assicurarsi che l'mRNA venga prodotto correttamente. Se ci sono errori, possono sorgere problemi nelle proteine prodotte. Un metodo principale di controllo di qualità è chiamato degradazione dell'mRNA mediata da nonsense (NMD). Questo processo identifica ed elimina gli mRNA difettosi che presentano errori, prevenendo la produzione di proteine incomplete o dannose. I fallimenti in questo controllo di qualità possono portare a varie malattie.
Gli mRNA difettosi possono provenire da diverse fonti, comprese le modifiche nel DNA o variazioni nel modo in cui l'RNA viene spliced. Nonostante la sua importanza, la rappresentazione dei trascritti relazionati al NMD nelle banche dati genetiche disponibili non è completa.
Comprendere la Degradazione Mediata da Nonsense (NMD)
Ci sono due modi principali per spiegare come si attiva il NMD, ma il metodo più studiato coinvolge una struttura chiamata complesso di giunzione degli esoni (EJC). Dopo lo splicing, questo complesso si forma attorno alle giunzioni degli esoni, dove rimane fino a quando l'mRNA non viene tradotto. Normalmente, i ribosomi rimuovono questi complessi mentre leggono l'mRNA. Tuttavia, se la traduzione si interrompe a un Codone di stop prematuro, alcuni componenti dell'EJC saranno ancora presenti. Questo EJC residuo è cruciale per attivare il NMD.
Una volta attivato, il NMD inizia una serie di eventi che degradano l'mRNA difettoso, assicurando che l'RNA potenzialmente dannoso venga rapidamente eliminato. Questo processo comporta la modifica di una proteina chiamata UPF1, che apre la strada alla scomposizione dell'mRNA difettoso.
Esiste anche un modello alternativo di attivazione del NMD che coinvolge regioni non tradotte più lunghe (UTR) dell'mRNA. Queste regioni più lunghe possono aiutare il legame di UPF1, ma i meccanismi specifici di questo processo sono ancora dibattuti. Non tutti gli mRNA con un'UTR lunga saranno soggetti al NMD, poiché alcune proteine leganti possono impedire il processo di degradazione.
Annotazione dei Geni e NMD
I progetti di annotazione dei geni, come il database Ensembl, sono fondamentali per identificare gli mRNA che sono obiettivi del NMD. Tuttavia, queste banche dati spesso non sono aggiornate con le ultime scoperte riguardanti le varianti di RNA recentemente scoperte. Anche se ci sono molti dati sulle mutazioni nonsense, ci sono poche banche dati focalizzate sugli eventi di splicing che potrebbero portare all'attivazione del NMD. Raccogliere informazioni precise su quali trascritti siano influenzati dal NMD rimane una sfida.
Studio dell'Espressione Genica nel Contesto NMD
Nella nostra ricerca, abbiamo analizzato l'espressione genica di quattro linee cellulari umane in diverse condizioni, puntando specificamente a tre fattori chiave del NMD: SMG5, SMG6 e SMG7. Abbiamo anche creato un flusso di lavoro computazionale per identificare quali mRNA siano sensibili al NMD e per annotare il loro stato riguardo ai codoni di stop prematuri.
Il nostro database, NMDtxDB, contiene dati provenienti da 54 librerie di RNA derivate da queste quattro linee cellulari. Le librerie sono state sequenziate per creare una mappa dettagliata dell'espressione dei trascritti. Un sottoinsieme è stato sequenziato anche utilizzando un metodo che cattura sequenze di RNA più lunghe per comprendere meglio le strutture di mRNA coinvolte nel NMD.
Sfide nell'Assemblaggio del Trascrittoma
Una sfida significativa nell'analizzare i dati RNA è la limitazione della lunghezza dei brevi read delle tecnologie di sequenziamento. Per affrontare questo, abbiamo adottato un metodo che integra sia letture brevi che lunghe per ricostruire accuratamente l'intero trascrittoma. Le letture lunghe ci danno maggiori informazioni sulla struttura completa dei trascritti e aiutano a identificare quelli presenti in basse quantità.
Abbiamo ottimizzato con attenzione il nostro processo di assemblaggio utilizzando dati provenienti da banche dati esistenti per assicurarci di poter classificare accuratamente i trascritti come riferimento o nuovi. Attraverso questo processo di assemblaggio, abbiamo identificato oltre 302.000 trascritti attraverso vari geni, evidenziando la complessità del trascrittoma, specialmente nelle cellule in cui i fattori NMD erano ridotti.
Identificazione delle Sequenze Codificanti e Stato NMD
Per determinare quali trascritti siano influenzati dal NMD, abbiamo annotato le posizioni dei codoni di stop che potrebbero indicare errori. Questo ha comportato l'integrazione di informazioni provenienti da varie banche dati di sequenze codificanti. Applicando la nostra regola stabilita, siamo stati in grado di identificare trascritti con codoni di stop prematuri e fornire spunti sul loro potenziale di essere colpiti dal NMD.
Dalla nostra analisi, abbiamo scoperto che un numero considerevole di trascritti conteneva codoni di stop prematuri, suggerendo che queste sezioni di RNA potrebbero essere eliminate dal processo NMD. Abbiamo anche notato differenze nel numero di trascritti influenzati a seconda della loro classificazione rispetto ai trascritti di riferimento noti.
Analisi dell'Espressione di Geni e Trascritti
Capire come cambia l'espressione genica quando i fattori NMD sono ridotti è essenziale per identificare gli obiettivi del NMD. Abbiamo esaminato i livelli di espressione nei nostri dataset, confrontando i campioni trattati con i controlli. La nostra analisi ha mostrato che una maggior parte significativa dei geni era sovraespressa in condizioni in cui il NMD era meno attivo.
Abbiamo ulteriormente integrato i dati di espressione differenziale con le nostre scoperte dall'analisi dei codoni di stop prematuri. Questo ci ha aiutato a capire come la riduzione dei fattori NMD influenzi l'espressione dei trascritti e la relazione tra i PTC e la regolazione genica.
Interfaccia Web NMDtxDB
Le informazioni raccolte dalla nostra ricerca sono accessibili tramite l'interfaccia web di NMDtxDB. Questa piattaforma è progettata per essere facile da usare e consente ai ricercatori di recuperare rapidamente informazioni sull'espressione di geni e trascritti. Gli utenti possono visualizzare i dettagli su specifici geni e i loro trascritti, inclusi collegamenti ad altre banche dati rilevanti per ulteriori esplorazioni.
In sintesi, l'interfaccia web fornisce una risorsa completa per studiare l'impatto del NMD sull'espressione genica, aiutando gli utenti a navigare tra dati complessi in modo intuitivo.
Direzioni Future e Obiettivi
Man mano che la nostra comprensione del NMD e delle sue implicazioni per l'espressione genica continua a evolversi, miriamo ad espandere NMDtxDB per includere ulteriori tipi di dati, migliorando la sua utilità per i ricercatori. Gli aggiornamenti futuri potrebbero coinvolgere l'incorporazione di dati provenienti da altri studi contemporanei e l'uso di metodi computazionali avanzati per affinare la nostra comprensione dei trascritti sensibili al NMD.
Con la natura open-source di questo database, NMDtxDB può essere una risorsa preziosa per esaminare come il NMD interagisce con la regolazione genica e i suoi effetti sulla salute umana. Fornendo un approccio semplificato per accedere e interpretare informazioni legate al NMD, speriamo di facilitare ulteriori ricerche e scoperte in quest'area importante della biologia.
Titolo: NMDtxDB: Data-driven identification and annotation of human NMD target transcripts
Estratto: The nonsense-mediated RNA decay (NMD) pathway is a crucial mechanism of mRNA quality control. Current annotations of NMD substrate RNAs are rarely data-driven, but use general established rules. We introduce a dataset with 4 cell lines and combinations for SMG5, SMG6 and SMG7 knockdowns or SMG7 knockout. Based on this dataset, we implemented a workflow that combines Nanopore and Illumina sequencing to assemble a transcriptome, which is enriched for NMD target transcripts. Moreover, we use coding sequence information from Ensembl, Gencode consensus RiboSeq ORFs and OpenProt to enhance the CDS annotation of novel transcript isoforms. 302,889 transcripts were obtained from the transcriptome assembly process, out of which, 48,213 contain a premature stop codon and 6,433 are significantly up regulated in three or more comparisons of NMD active vs deficient cell lines. We present an in-depth view on these results through the NMDtxDB database, which is available at https://shiny.dieterichlab.org/app/NMDtxDB, and supports the study of NMD-sensitive transcripts. We open sourced our implementation of the respective web-application and analysis workflow at https://github.com/dieterich-lab/NMDtxDB and https://github.com/dieterich-lab/nmd-wf.
Autori: Christoph Dieterich, T. Britto-Borges, N. H. Gehring, V. Boehm
Ultimo aggiornamento: 2024-02-02 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.01.31.578146
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.31.578146.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.