Prevedere l'efficacia di gRNA con launch-dCas9
Nuovo modello migliora le previsioni per la ricerca sulla regolazione genica.
― 7 leggere min
Indice
- L'importanza del GRNA in CRISPRi
- Prevedere l'efficacia del gRNA
- Sfide nei modelli attuali
- Lacune nella ricerca
- Introduzione di launch-dCas9
- Caratteristiche utilizzate in launch-dCas9
- Valutare launch-dCas9
- Abbonanza di gRNA nelle cellule Wild-Type
- Prevedere i livelli di Espressione genica
- Relazione tra espressione genica e fitness cellulare
- Generalizzabilità tra diverse cellule
- Conclusione
- Direzioni future
- Ulteriori approfondimenti
- Fonte originale
- Link di riferimento
CRISPRi è uno strumento che gli scienziati usano per spegnere i geni senza cambiare il DNA effettivo. Questo metodo aiuta i ricercatori a capire cosa fanno certe parti del DNA, soprattutto quelle che non codificano per le proteine ma che hanno un ruolo cruciale nella regolazione dei geni. Usando CRISPRi, gli scienziati possono vedere come spegnere un gene specifico influisce sul comportamento delle cellule.
GRNA in CRISPRi
L'importanza delAl centro di CRISPRi ci sono gli RNA guida, o gRNA. Questi gRNA sono progettati per mirare a regioni specifiche del DNA. Quando un gRNA corrisponde a una parte del DNA, può aiutare a bloccare l'azione del gene. In questo modo, i ricercatori possono studiare cosa succede quando il gene non è attivo. Per questo motivo, scegliere il giusto gRNA è molto importante per esperimenti di successo.
Prevedere l'efficacia del gRNA
Anche se ci sono tanti gRNA disponibili, non tutti funzionano allo stesso modo. Può essere difficile e richiedere tempo sperimentare ogni possibile gRNA per scoprire quali funzionano meglio. Ecco perché i ricercatori vogliono creare modelli che possano prevedere quanto bene un gRNA performi basandosi su dati già esistenti. Questi modelli possono aiutare gli scienziati a selezionare i gRNA più promettenti per i loro studi.
Sfide nei modelli attuali
La maggior parte dei modelli di previsione disponibili oggi si è concentrata sui cambiamenti genetici causati da CRISPR, piuttosto che sui cambiamenti epigenetici indotti da CRISPRi. Questo significa che potrebbero non essere completamente attrezzati per prevedere quanto sarà efficace un dato gRNA utilizzando CRISPRi. Inoltre, molti dei modelli esistenti guardano solo a specifiche aree del DNA, limitando la loro efficacia nel prevedere i risultati in generale.
Lacune nella ricerca
Ci sono ancora alcune aree importanti che necessitano di attenzione. Prima di tutto, i ricercatori hanno bisogno di modelli migliori che possano prevedere l'utilità dei gRNA che mirano alle regioni Enhancer, spesso trascurate. Inoltre, i modelli dovrebbero integrare vari tipi di informazioni oltre alla sequenza del DNA, comprese caratteristiche come la struttura del DNA e altre molecole circostanti. Infine, è importante che i modelli di previsione possano fornire informazioni su più risultati, come come i gRNA influenzano la salute cellulare e quanto spesso si trovano nelle cellule.
Introduzione di launch-dCas9
Per affrontare queste lacune, è stato sviluppato un nuovo modello chiamato launch-dCas9. Questo modello è progettato per prevedere quanto possono essere efficaci diversi gRNA su molteplici risultati, inclusa la salute cellulare e l'attività genica. Il modello launch-dCas9 utilizza metodi avanzati, tra cui deep learning e una tecnica chiamata XGBoost, per analizzare una grande quantità di dati.
Caratteristiche utilizzate in launch-dCas9
Launch-dCas9 utilizza diversi tipi di informazioni come input. Questo include la sequenza effettiva dei gRNA insieme ad altre caratteristiche che descrivono la funzione dei gRNA e i loro siti target nel DNA. Combinando questi vari pezzi di informazione, il modello può fare previsioni migliori su come i gRNA si comporteranno negli esperimenti reali.
Valutare launch-dCas9
La performance di launch-dCas9 è stata testata su diversi dataset del mondo reale. I ricercatori hanno esaminato quanto bene il modello poteva prevedere l'efficacia dei gRNA su risultati cellulari cruciali, come la crescita cellulare. Hanno esaminato sia le regioni promoter che quelle enhancer per vedere come il modello si comportava.
Risultati nelle regioni promoter
Nelle regioni promoter del DNA, sia i metodi CNN che XGBoost hanno mostrato risultati simili. Quando i ricercatori hanno utilizzato un insieme completo di caratteristiche, i modelli sono stati in grado di prevedere i risultati ragionevolmente bene. Tuttavia, quando è stata utilizzata solo l'informazione di sequenza o solo l'informazione di annotazione, i modelli non hanno performato in modo altrettanto efficace. Questo mostra che entrambi i tipi di informazioni sono importanti per previsioni accurate.
Importanza delle annotazioni funzionali
I ricercatori hanno valutato quali caratteristiche erano più importanti per le previsioni. Hanno scoperto che le annotazioni funzionali-informazioni riguardo ai ruoli delle sequenze di DNA-erano critiche. Alcune caratteristiche erano costantemente associate a gRNA che avevano forti effetti sulla crescita cellulare.
Risultati nelle regioni enhancer
Per i gRNA che mirano alle regioni enhancer, i modelli hanno di nuovo mostrato prestazioni simili. Tuttavia, in quest'area, l'informazione di sequenza era più critica rispetto alle annotazioni. Questo suggerisce che comprendere la sequenza di DNA specifica è necessario per prevedere i risultati negli enhancer, mentre le annotazioni funzionali sono più essenziali nelle regioni promoter.
Importanza dei top gRNA
I ricercatori hanno anche esaminato da vicino i gRNA top previsti sia per le regioni promoter che per quelle enhancer. Hanno trovato che questi gRNA top avevano risultati sperimentali migliori rispetto agli altri. Questo sottolinea la capacità del modello di identificare i gRNA più promettenti per gli scienziati da usare nei loro studi.
Abbonanza di gRNA nelle cellule Wild-Type
L'efficacia di un gRNA è anche legata a quante copie di esso possono essere trovate nelle cellule wild-type, che sono cellule senza modifiche. I ricercatori hanno cercato di vedere se launch-dCas9 potesse prevedere quali gRNA tendono ad esistere in quantità inferiori in condizioni wild-type. Il modello è stato testato utilizzando solo informazioni di sequenza, poiché non si prevedeva che altre caratteristiche influenzassero le quantità di gRNA.
Performance di CNN e XGBoost
Entrambi i metodi, CNN e XGBoost, hanno mostrato una forte capacità di prevedere i conteggi di gRNA nelle cellule wild-type. La CNN ha performato meglio perché poteva usare informazioni di sequenza più dettagliate, mentre il modello XGBoost si basava su input più semplici.
Espressione genica
Prevedere i livelli diOltre a prevedere la fitness cellulare, gli scienziati erano interessati a come i gRNA influenzano l'espressione genica nei geni vicini. Hanno addestrato il modello launch-dCas9 per determinare se un gRNA avesse un effetto evidente sull'espressione dei geni situati vicino a esso.
Performance dei modelli
Quando si valutavano i modelli per l'espressione genica, sia la CNN che l'XGBoost hanno performato in modo simile. Tuttavia, quando si utilizzava solo l'informazione di sequenza, i modelli hanno performato male. Questo indica che le annotazioni funzionali giocano anche un ruolo significativo nella previsione degli effetti sull'espressione genica.
Relazione tra espressione genica e fitness cellulare
I ricercatori hanno cercato di capire la connessione tra gRNA che influenzano la fitness cellulare e i cambiamenti nell'espressione genica. Hanno trovato che i gRNA legati a impatti significativi sulla crescita cellulare erano anche più propensi ad influenzare l'espressione genica nei geni vicini. Questo suggerisce che i cambiamenti nell'espressione genica potrebbero essere un modo in cui i gRNA influenzano la salute cellulare complessiva.
Generalizzabilità tra diverse cellule
Per vedere quanto bene launch-dCas9 potesse funzionare attraverso diversi tipi di cellule, i ricercatori lo hanno testato usando dati provenienti da varie linee cellulari che miravano alle stesse regioni genomiche. Hanno scoperto che il modello funzionava meglio quando i dati di addestramento e test provenivano dallo stesso tipo cellulare, ma offriva ancora previsioni ragionevoli tra diversi tipi di cellule.
Caratteristiche chiave in diverse linee cellulari
L'importanza di specifiche caratteristiche era piuttosto coerente tra i diversi tipi di cellule. Questo suggerisce che alcuni elementi della sequenza del gRNA sono universalmente importanti per prevedere la sua efficacia, indipendentemente dal tipo cellulare.
Conclusione
I ricercatori hanno sviluppato launch-dCas9 come uno strumento potente per aiutare a prevedere l'efficacia dei gRNA negli esperimenti di CRISPRi. Combinando vari tipi di dati, il modello può guidare gli scienziati nella selezione dei migliori gRNA per la loro ricerca. Questo non solo snellisce il processo di progettazione degli esperimenti, ma ha anche il potenziale per migliorare i risultati negli studi mirati a comprendere la regolazione genetica.
Direzioni future
Lo studio indica che c'è ancora molto da imparare su come funzionano i gRNA, specialmente in diversi contesti. La ricerca futura potrebbe portare a una comprensione ancora più profonda della regolazione genica, aiutando gli scienziati a identificare target cruciali per terapie che affrontano varie malattie. Questo potrebbe portare, in ultima analisi, a trattamenti più efficaci basati sulle intuizioni ottenute attraverso strumenti come launch-dCas9.
Ulteriori approfondimenti
Man mano che più ricercatori adottano CRISPRi e strumenti come launch-dCas9, la comunità scientifica avrà accesso a modi migliori per studiare la regolazione genetica. Questo lavoro continuo aiuterà a svelare le complesse interazioni tra i geni e fornirà un quadro più chiaro di come l'espressione genica influisca sul comportamento cellulare. Continuando a perfezionare questi modelli predittivi, i ricercatori possono migliorare ulteriormente la loro capacità di manipolare i geni, portando a progressi nella medicina e nella ricerca biologica.
Attraverso questi progressi, la speranza è non solo di capire meglio i meccanismi della genetica, ma anche di sfruttare questa conoscenza per sviluppare nuove strategie per trattare le malattie alla loro fonte.
Titolo: Machine learning methods for predicting guide RNA effects in CRISPR epigenome editing experiments
Estratto: CRISPR epigenomic editing technologies enable functional interrogation of non-coding elements. However, current computational methods for guide RNA (gRNA) design do not effectively predict the power potential, molecular and cellular impact to optimize for efficient gRNAs, which are crucial for successful applications of these technologies. We present "launch-dCas9" (machine LeArning based UNified CompreHensive framework for CRISPR-dCas9) to predict gRNA impact from multiple perspectives, including cell fitness, wild-type abundance (gauging power potential), and gene expression in single cells. Our launch-dCas9, built and evaluated using experiments involving >1 million gRNAs targeted across the human genome, demonstrates relatively high prediction accuracy (AUC up to 0.81) and generalizes across cell lines. Method-prioritized top gRNA(s) are 4.6-fold more likely to exert effects, compared to other gRNAs in the same cis-regulatory region. Furthermore, launch-dCas9 identifies the most critical sequence-related features and functional annotations from >40 features considered. Our results establish launch-dCas9 as a promising approach to design gRNAs for CRISPR epigenomic experiments.
Autori: Yun Li, W. Mu, T. Luo, A. Barrera, L. R. Bounds, T. S. Klann, M. t. Weele, J. Bryois, G. E. Crawford, P. F. E. Sullivan, C. A. Gersbach, M. I. Love
Ultimo aggiornamento: 2024-04-19 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.04.18.590188
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.18.590188.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.