Avanzamenti nel CRISPR: Un Nuovo Approccio ai Rischi Off-Target
Metodi innovativi migliorano la precisione del CRISPR nell'editing genico e nella valutazione degli effetti off-target.
― 7 leggere min
La tecnologia CRISPR è uno strumento importante nel campo dell'editing genomico. Permette agli scienziati di modificare parti specifiche del DNA di un organismo. Questo metodo utilizza un componente speciale chiamato nucleasi associata a CRISPR (Cas) insieme a un RNA guida. L'RNA guida indirizza la nucleasi verso l'area esatta del DNA dove devono essere apportate le modifiche.
Una parte cruciale di questo processo è l'RNA guida, o GRNA, che può essere modificato per mirare a regioni specifiche del DNA. Per un tipo di prodotto CRISPR, Cas9, le aree target specifiche sono determinate da una sequenza nota come PAM, e le 20 basi prima di essa aiutano a creare il gRNA. Negli ultimi dieci anni, CRISPR è stato utilizzato in vari modi. Gli scienziati hanno creato modelli animali per studiare malattie, lavorato per salvare specie in pericolo, aumentato la resilienza delle colture e sviluppato nuovi trattamenti.
Nonostante i molti usi di CRISPR, creare gRNA efficaci è una sfida. È fondamentale ridurre le possibilità di cambiamenti indesiderati nel genoma. Anche se avere una sequenza nucleotidica unica di 20 è cruciale, non basta. A volte, sequenze che non sono il bersaglio previsto possono comunque essere modificate se assomigliano troppo al gRNA. Questi cambiamenti indesiderati si chiamano modifiche off-target, che avvengono quando ci sono da uno a quattro errori nella sequenza.
Per affrontare i rischi off-target, sono stati creati diversi metodi per valutare i potenziali pericoli. Due metodi noti sono il punteggio di Zhang e il punteggio di Cutting Frequency Determination (CFD). Entrambi i metodi valutano i gRNA candidati calcolando punteggi che riflettono quanto siano probabili i cambiamenti off-target. Tuttavia, entrambi i metodi si basano sull'avere un elenco completo dei siti off-target possibili per un gRNA.
Questo significa che per ogni RNA guida, gli scienziati devono identificare ogni potenziale sito CRISPR nell'intero genoma che potrebbe avere fino a quattro differenze dall'RNA guida. Questo metodo di forza bruta diventa impraticabile perché i grandi genomi contengono miliardi di possibili siti CRISPR. Per affrontare questa sfida, è stato sviluppato un nuovo strumento chiamato Crackling. Crackling utilizza una struttura nota come Inverted Signature Slice Lists (ISSL) per identificare rapidamente i potenziali siti off-target senza dover confrontare ogni posizione possibile.
ISSL funziona organizzando l'area di ricerca in parti più piccole. Ogni sito è suddiviso in fette di lunghezza fissa. Ad esempio, se una posizione nel DNA è divisa in cinque fette, ogni fetta potrebbe essere lunga quattro nucleotidi. Facendo così, l'ISSL può trovare rapidamente un'area più piccola di potenziali siti off-target, assicurando che tutti i veri siti off-target siano inclusi mantenendo la dimensione gestibile.
Questa struttura riduce il tempo necessario per eseguire l'analisi. Quando i punteggi off-target per un RNA guida devono essere calcolati, anche l'RNA guida viene suddiviso in fette utilizzando lo stesso approccio. Ogni fetta viene quindi confrontata con siti vicini usando una cosa chiamata distanza di Hamming, che aiuta a identificare i siti off-target. Se la distanza è di quattro errori o meno, viene confermato come un vero sito off-target.
Lo strumento Crackling si è rivelato significativamente più veloce rispetto ad altri strumenti esistenti, offrendo un miglioramento notevole in termini di velocità ed efficienza. Tuttavia, c'era ancora interesse nel ridefinire ulteriormente la costruzione dei vicinati per renderla ancora più efficace. L'obiettivo era ottenere vicinati più stretti attorno ai gRNA, assicurandosi che tutti i veri siti off-target siano conteggiati.
Ridurre la dimensione del vicinato è essenziale perché vicinati più grandi possono portare a calcoli non necessari. Nei metodi precedenti, la dimensione dei vicinati poteva diventare eccessivamente grande a causa di come i dati erano disposti. Il modo in cui questi disposizioni erano settate poteva portare a includere molte sequenze irrilevanti. Per ridurre le dimensioni dei vicinati, il nuovo approccio è passato dall'osservare corrispondenze contigue all'utilizzo di disposizioni non contigue note come maschere.
Per creare insiemi validi di maschere, l'obiettivo era assicurarsi che ogni possibile sito off-target avesse almeno una maschera che potesse catturarlo. Questo significa che doveva esserci una rappresentazione degli errori tra l'RNA guida e i siti off-target. I ricercatori sono stati in grado di utilizzare un approccio binario per rappresentare corrispondenze e errori, consentendo un controllo efficace dei siti off-target.
Per costruire un insieme iniziale valido di maschere, i ricercatori hanno preso un insieme vuoto e hanno iniziato ad aggiungere maschere che catturavano il maggior numero di combinazioni off-target. Questo approccio avaro ha assicurato che tutte le combinazioni fossero eventualmente catturate, ma ha anche portato a insiemi più grandi di quanto desiderato. Man mano che la dimensione dell'insieme di maschere aumentava, aumentava anche la memoria richiesta per elaborare i dati. I ricercatori miravano a creare insiemi più piccoli per alleviare la pressione sulla memoria e velocizzare l'elaborazione.
Il processo di ottimizzazione ha comportato la ricerca di insiemi validi di maschere. Partendo da una raccolta casuale di maschere, ogni insieme è stato valutato in base alla sua capacità di catturare combinazioni off-target. Gli insiemi con le migliori prestazioni sono stati mantenuti, mentre quelli meno riusciti sono stati scartati. Questo processo è continuato finché non è stato trovato un insieme valido. Era anche importante ridurre la dimensione dell'insieme di maschere, poiché set più grandi portavano a tempi di elaborazione più lunghi e a requisiti di memoria aumentati.
È stato impostato un benchmark per testare il nuovo metodo rispetto alle versioni precedenti e ad altri strumenti disponibili. I test hanno utilizzato vari genomi, compresi alcuni che in precedenza erano troppo grandi per essere gestiti da altri strumenti. Le prestazioni sono state misurate guardando quanto tempo ci è voluto per elaborare insiemi di gRNA selezionati casualmente su questi genomi.
La ricerca ha confrontato diverse configurazioni per valutare quanti maschere fossero necessari e quali pesi funzionassero meglio. Attraverso i test, le configurazioni di maschere ottimizzate hanno mostrato promesse, riducendo significativamente il tempo necessario per l'elaborazione. Lo studio ha scoperto che per genomi più grandi, utilizzare un peso maschera di dieci dava i migliori risultati, mentre per genomi più piccoli i migliori risultati si ottenevano con un peso maschera di otto.
I risultati hanno indicato che utilizzare la versione ottimizzata dell'approccio maschera ha costantemente funzionato meglio rispetto ai metodi precedenti, dimostrando come ridurre il numero di sequenze da controllare possa portare a risultati più rapidi. I risultati hanno supportato l'idea che insiemi di maschere più piccoli e più efficaci possano essere benefici, specialmente considerata la crescente dimensione dei dati genomici.
Man mano che gli approcci continuavano a evolversi, la necessità di una grande memoria fisica è diventata un problema, specialmente per genomi più grandi. Questo ha portato a un cambio verso l'implementazione di file mappati in memoria. Utilizzando il memory mapping, gli strumenti potevano accedere ai dati senza dover caricare tutto in memoria, consentendo di elaborare genomi più ampi senza bloccarsi o rallentare.
La conclusione tratta dallo studio ha mostrato che, mentre la tecnologia CRISPR è già uno strumento potente per l'editing genomico, c'è ancora spazio per miglioramenti significativi. I progressi fatti con l'approccio basato sulle maschere hanno fornito un metodo più veloce e snodato per valutare i rischi off-target. Lo sviluppo dell'implementazione mappata in memoria è stato cruciale per consentire allo strumento di scalare e funzionare in modo efficiente su varie dimensioni di genoma.
I lavori futuri in quest'area probabilmente comporteranno ulteriori ottimizzazioni della velocità e dell'accuratezza nell'identificazione dei siti off-target, affrontando anche le limitazioni imposte dalle dimensioni crescenti dei dati. In generale, i risultati evidenziano l'importanza dell'innovazione continua negli strumenti e nelle metodologie per meglio sfruttare le capacità della tecnologia CRISPR e di altri sistemi di editing genomico.
Titolo: Fast and scalable off-target assessment for CRISPR guide RNAs using partial matches
Estratto: The design of CRISPR-Cas9 guide RNAs is not trivial. In particular, it is crucial to evaluate the risk of unintended, off-target modifications, but this is computationally expensive. To avoid a brute-force approach where each guide RNA is compared against every possible CRISPR target site in the genome, we previously introduced Crackling, a guide RNA design tool that relies on exact matches over 4bp subsequences to approximate a neighbourhood and accelerate off-target scoring by greatly reducing the search space. While this was faster than other existing tools, it still generates large neighbourhoods. Here, we aim to further reduce the search space by requiring more, now non-contiguous, exact matches. The new implementation, called Crackling++, is benchmarked against our initial approach and other off-target evaluation tools. We show that it provides the fastest way to assess candidate guide RNAs. By using memorymapped files, it also scales to the largest genomes. Crackling++ is available at https://github.com/bmds-lab/CracklingPlusPlus under the Berkeley Software Distribution (BSD) 3-Clause license.
Autori: Dimitri Perrin, C. Schmitz, J. Bradford, R. Salomone
Ultimo aggiornamento: 2024-02-02 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.02.01.578509
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.01.578509.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.