Presentiamo gRNAde: una nuova era nel design dell'RNA
Uno strumento innovativo per progettare sequenze di RNA in base alle loro forme.
― 6 leggere min
Indice
In passato, la maggior parte degli sforzi per trovare nuovi medicinali si concentrava su piccole molecole o Proteine. Questi trattamenti di solito mirano a alleviare i sintomi o affrontare le fasi finali delle malattie. Recentemente, c'è stato più interesse nella creazione di trattamenti basati su RNA che possono agire prima nel processo di malattia. Mirando all'RNA, possiamo potenzialmente fermare i messaggi dannosi nelle cellule che contribuiscono alla malattia. Esempi di tecnologia RNA che stanno facendo notizia oggi includono i vaccini mRNA e l'editing genetico basato su CRISPR.
Un'area interessante della ricerca sull'RNA coinvolge strutture RNA specifiche chiamate ribozimi e riboswitches. Queste strutture possono regolare come i geni vengono espressi in base alle necessità della cellula. Cambiano la loro forma quando sono presenti certe piccole molecole, il che può controllare se una particolare proteina venga prodotta o meno. La progettazione mirata di questi riboswitches potrebbe portare a terapie RNA precise in futuro.
Sfide della modellazione RNA
Nonostante i progressi nella ricerca sull'RNA, la maggior parte dell'attenzione è ancora rivolta alle proteine nel campo della modellazione molecolare. Ci sono molte strutture proteiche disponibili, il che ha portato a grandi progressi nella previsione delle Forme delle proteine utilizzando metodi informatici avanzati. Tuttavia, quando si tratta di RNA, gli strumenti che abbiamo sono limitati. La maggior parte dei metodi di progettazione dell'RNA considera solo forme di base, ignorando le forme tridimensionali più complesse. Per questo motivo, i modelli spesso faticano a catturare completamente come l'RNA può cambiare e comportarsi nella vita reale.
L'RNA è unico perché può assumere molte forme diverse, ognuna cruciale per la sua funzione nella cellula. Questo rende la progettazione di nuove strutture RNA una grande sfida, poiché dobbiamo considerare sia la forma che la sua capacità di cambiare.
Introduzione di gRNAde
Questo documento presenta gRNAde, un nuovo strumento che utilizza metodi informatici avanzati per progettare Sequenze RNA in base alle loro forme tridimensionali. gRNAde funziona in modo simile agli strumenti di progettazione delle proteine esistenti, ma è stato creato specificamente per l'RNA.
Il sistema gRNAde prende una o più strutture RNA e le utilizza per generare possibili sequenze RNA che potrebbero adattarsi a quelle forme. Lo strumento è stato addestrato con migliaia di strutture RNA provenienti da varie fonti, permettendogli di gestire diversi tipi di RNA, da molecole piccole a maggiori.
Come funziona gRNAde
gRNAde elabora le forme RNA utilizzando un tipo speciale di modello informatico che apprende dalla geometria delle strutture RNA. Questo modello può comprendere come mantenere gli aspetti importanti delle diverse forme RNA mentre trova modi per creare sequenze che si adattino.
Uno dei principali vantaggi di gRNAde è la sua capacità di lavorare con più forme RNA contemporaneamente. Questa caratteristica gli consente di comprendere meglio come l'RNA può cambiare forma in natura, che è spesso importante per la sua funzione.
Confronto delle prestazioni
Quando testiamo gRNAde, possiamo confrontarlo con uno strumento esistente chiamato Rosetta, noto per la sua capacità di progettare sequenze RNA in base alle loro forme. Nei test con diverse forme RNA, gRNAde ha sempre superato Rosetta, recuperando una percentuale maggiore della sequenza originale. Inoltre, gRNAde è molto più veloce, capace di produrre molti design in meno di un secondo, rispetto al tempo più lungo richiesto da Rosetta per compiti simili.
Capacità di progettazione multi-stato
Una delle caratteristiche distintive di gRNAde è la sua capacità di gestire RNA che può esistere in forme diverse. Molte molecole RNA devono cambiare forma per svolgere correttamente il loro lavoro. Per esempio, alcune strutture hanno uno stato legato e uno stato non legato, che influisce su come funzionano nel corpo.
gRNAde può progettare specificamente sequenze basate su queste forme variabili, aumentando così la sua utilità in situazioni reali. Questa caratteristica è particolarmente preziosa quando si considerano strutture RNA che devono adattarsi al loro ambiente.
Comprendere la dinamica dell'RNA
gRNAde non riguarda solo la progettazione di sequenze, ma anche la cattura efficace della natura dinamica dell'RNA. L'input per gRNAde include varie forme di RNA, che vengono poi analizzate per produrre rappresentazioni geometriche dettagliate. Ogni nucleotide RNA è trattato come parte di una struttura più grande, con connessioni ai nucleotidi vicini in base al loro posizionamento spaziale.
Questa rappresentazione geometrica consente a gRNAde di analizzare l'RNA in modo efficace. Ogni nucleotide è trattato come un nodo in un grafo, con connessioni che rappresentano come interagiscono tra loro. Questo metodo aiuta a prevedere quanto bene una sequenza progettata si ripiegherà in una specifica struttura tridimensionale.
Vantaggi dell'uso di gRNAde
Percentuali di recupero più alte: Quando testato contro modelli esistenti, gRNAde ha mostrato un miglioramento significativo nel recupero delle sequenze originali, rendendolo una scelta più affidabile per la progettazione di sequenze RNA.
Velocità: gRNAde può generare centinaia di design RNA in una frazione di secondo grazie ai suoi algoritmi avanzati, rendendolo molto più veloce dei metodi tradizionali.
Progettazione multi-stato: Permette ai ricercatori di lavorare con RNA che può cambiare forma, essenziale per comprendere come funzionano nei sistemi biologici.
Facile da usare: Con il suo setup semplice, gRNAde rende la progettazione dell'RNA più accessibile ai ricercatori che potrebbero non avere esperienza in questo campo.
Valutazione dei design RNA
Per determinare quanto siano efficaci i design generati da gRNAde, vengono utilizzate certe metriche:
Recupero della sequenza nativa: Questa metrica misura quanti dei nucleotidi originali si trovano nelle sequenze generate da gRNAde.
Coerenza della struttura secondaria: Questa valuta quanto bene le sequenze progettate corrispondano alla struttura secondaria attesa, che è fondamentale per una corretta funzione.
Perplessità: Questa metrica indica quanto il modello sia fiducioso nelle sue previsioni. Un punteggio di perplessità inferiore suggerisce che il modello fa previsioni più accurate.
Dati sperimentali e impostazione
Per creare una base per gRNAde, è stato costruito un dataset di strutture RNA, focalizzandosi su una vasta gamma di tipi RNA unici. Questo dataset garantisce che gRNAde possa apprendere e generalizzare efficacemente in vari scenari.
La suddivisione del training è stata organizzata attentamente per impedire al modello di vedere strutture troppo simili durante la fase di addestramento, assicurando così che possa adattarsi bene a nuove sequenze RNA.
Direzioni future
Anche se gRNAde mostra grandi promise, ci sono ancora aree da migliorare. Attualmente, non supporta strutture RNA che interagiscono con proteine o piccole molecole, il che è spesso cruciale per comprendere la funzione dell'RNA. Ulteriori sviluppi potrebbero consentire l'incorporazione di queste interazioni.
Un'altra area potenziale per il progresso è la capacità di gestire più catene RNA interattive, ampliando ulteriormente l'utilità dello strumento nei sistemi biologici complessi.
Con il continuare della ricerca e la determinazione di più strutture RNA, strumenti come gRNAde potrebbero diventare ancora più affilati ed efficaci, aprendo nuove vie per le terapie basate su RNA e la biotecnologia.
Conclusione
gRNAde rappresenta un grande progresso nella progettazione di sequenze RNA, offrendo prestazioni e velocità migliorate rispetto agli strumenti esistenti. Con la sua capacità di gestire strutture RNA complesse e comportamenti dinamici, gRNAde stabilisce un nuovo standard nella progettazione computazionale dell'RNA, aprendo la strada a migliori strategie terapeutiche e a una comprensione più profonda delle funzioni dell'RNA nella biologia. Man mano che il campo continua a crescere, il potenziale per gRNAde e tecnologie simili è immenso, rendendolo un'area entusiasmante di ricerca per il futuro.
Titolo: gRNAde: Geometric Deep Learning for 3D RNA inverse design
Estratto: Computational RNA design tasks are often posed as inverse problems, where sequences are designed based on adopting a single desired secondary structure without considering 3D geometry and conformational diversity. We introduce gRNAde, a geometric RNA design pipeline operating on 3D RNA backbones to design sequences that explicitly account for structure and dynamics. gRNAde uses a multi-state Graph Neural Network and autoregressive decoding to generates candidate RNA sequences conditioned on one or more 3D backbone structures where the identities of the bases are unknown. On a single-state fixed backbone re-design benchmark of 14 RNA structures from the PDB identified by Das et al. (2010), gRNAde obtains higher native sequence recovery rates (56% on average) compared to Rosetta (45% on average), taking under a second to produce designs compared to the reported hours for Rosetta. We further demonstrate the utility of gRNAde on a new benchmark of multi-state design for structurally flexible RNAs, as well as zero-shot ranking of mutational fitness landscapes in a retrospective analysis of a recent ribozyme. Open source code: github.com/chaitjo/geometric-rna-design
Autori: Chaitanya K. Joshi, A. R. Jamasb, R. Vinas, C. Harris, S. V. Mathis, A. Morehead, R. Anand, P. Lio
Ultimo aggiornamento: 2024-10-06 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.03.31.587283
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.31.587283.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.