Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Avances en CRISPR: Un nuevo enfoque para los riesgos fuera de objetivo

Métodos innovadores mejoran la precisión de CRISPR en la edición del genoma y la evaluación de off-target.

― 8 minilectura


Nuevas herramientasNuevas herramientasCRISPR reducen losriesgos fuera delgenética.eficiencia de CRISPR para la ediciónMétodos simplificados mejoran la
Tabla de contenidos

La tecnología CRISPR es una herramienta importante en el campo de la edición del genoma. Permite a los científicos cambiar partes específicas del ADN de un organismo. Este método utiliza un componente especial conocido como nucleasa asociada a CRISPR (Cas) junto con un ARN guía. El ARN guía dirige la nucleasa al área exacta en el ADN donde se necesitan hacer cambios.

Una parte crucial de este proceso es el ARN guía, o gRNA, que se puede modificar para apuntar a regiones específicas del ADN. Para un tipo de producto CRISPR, Cas9, las áreas de destino específicas se determinan por una secuencia conocida como PAM, y las 20 bases antes de ella ayudan a crear el gRNA. En los últimos diez años, se ha utilizado CRISPR de varias maneras. Los científicos han creado modelos animales para estudiar enfermedades, trabajado en la conservación de especies en peligro, aumentado la resistencia de cultivos y desarrollado nuevos tratamientos.

A pesar de los muchos usos de CRISPR, crear GRNAS efectivos es un desafío. Es esencial minimizar las posibilidades de cambios no deseados en el genoma. Si bien tener una secuencia única de 20 nucleótidos es fundamental, no es suficiente. A veces, secuencias que no son el objetivo deseado pueden cambiar si se parecen mucho al gRNA. Estos cambios no deseados se llaman modificaciones fuera del objetivo, que ocurren cuando hay de uno a cuatro desajustes en la secuencia.

Para lidiar con los riesgos fuera del objetivo, se han creado varios métodos para evaluar los peligros potenciales. Dos métodos bien conocidos son el puntaje de Zhang y el puntaje de Determinación de Frecuencia de Corte (CFD). Ambos enfoques evalúan gRNAs candidatos calculando puntajes que reflejan cuán probable es que causen cambios fuera del objetivo. Sin embargo, ambos métodos dependen de tener una lista completa de posibles sitios fuera del objetivo para un gRNA.

Esto significa que para cada ARN guía, los científicos deben identificar cada posible sitio CRISPR en todo el genoma que podría tener hasta cuatro diferencias con el ARN guía. Este método de fuerza bruta se vuelve impráctico porque los genomas grandes contienen miles de millones de posibles sitios CRISPR. Para enfrentar este desafío, se desarrolló una nueva herramienta llamada Crackling. Crackling utiliza una estructura conocida como Listas de Cortes de Firma Invertida (ISSL) para identificar rápidamente los sitios fuera del objetivo sin tener que comparar cada posible ubicación.

ISSL funciona organizando el área de búsqueda en partes más pequeñas. Cada sitio se divide en porciones de longitud fija. Por ejemplo, si una ubicación en el ADN se divide en cinco porciones, cada porción podría tener cuatro nucleótidos de largo. Al hacer esto, ISSL puede encontrar rápidamente un vecindario más pequeño de posibles sitios fuera del objetivo, asegurando que todos los verdaderos sitios fuera del objetivo estén incluidos mientras se mantiene el tamaño manejable.

Esta estructura reduce el tiempo que tarda en realizar el análisis. Cuando se necesitan calcular los puntajes fuera del objetivo para un ARN guía, el ARN guía también se divide en porciones utilizando el mismo enfoque. Cada porción se compara con sitios cercanos utilizando algo llamado distancia de Hamming, que ayuda a identificar sitios fuera del objetivo. Si la distancia es de cuatro desajustes o menos, se confirma como un sitio fuera del objetivo real.

Se encontró que la herramienta Crackling era significativamente más rápida que otras herramientas existentes, proporcionando una mejora notable en velocidad y eficiencia. Sin embargo, aún había interés en rediseñar la construcción del vecindario para hacerla aún más efectiva. El objetivo era obtener vecindarios más ajustados alrededor de los gRNAs mientras se aseguraba que todos los sitios reales fuera del objetivo fueran contabilizados.

Reducir el tamaño del vecindario es esencial porque los vecindarios más grandes pueden llevar a cálculos innecesarios. En métodos anteriores, el tamaño de los vecindarios podía volverse excesivamente grande debido a cómo se organizaban los datos. La forma en que se configuraron estos arreglos podía llevar a incluir muchas secuencias irrelevantes. Para reducir los tamaños de los vecindarios, el nuevo enfoque pasó de buscar coincidencias contiguas a usar arreglos no contiguos conocidos como máscaras.

Para crear conjuntos válidos de máscaras, el objetivo era asegurar que cada posible sitio fuera del objetivo tuviera al menos una máscara que pudiera capturarlo. Esto significa que debía haber una representación de los desajustes entre el ARN guía y los sitios fuera del objetivo. Los investigadores pudieron usar un enfoque binario para representar coincidencias y desajustes, lo que permitió una verificación efectiva de los sitios fuera del objetivo.

Para construir un conjunto inicial válido de máscaras, los investigadores tomaron un conjunto vacío y comenzaron a agregar máscaras que capturaran la mayor cantidad de combinaciones fuera del objetivo. Este enfoque codicioso aseguró que eventualmente se capturaran todas las combinaciones, pero también condujo a conjuntos más grandes de lo deseado. A medida que aumentaba el tamaño del conjunto de máscaras, también lo hacía la memoria requerida para procesar los datos. Los investigadores tenían como objetivo crear conjuntos más pequeños para aliviar la carga de memoria y acelerar el procesamiento.

El proceso de optimización involucró buscar conjuntos válidos de máscaras. Comenzando desde una colección aleatoria de máscaras, cada conjunto fue evaluado en función de su capacidad para capturar combinaciones fuera del objetivo. Se mantuvieron los conjuntos con mejor rendimiento, mientras que los menos exitosos fueron descartados. Este proceso continuó hasta que se encontró un conjunto válido. También era importante reducir el tamaño del conjunto de máscaras, ya que conjuntos más grandes llevaban más tiempo de procesamiento y aumentaban los requerimientos de memoria.

Se estableció un punto de referencia para probar el nuevo método contra versiones anteriores y otras herramientas disponibles. Las pruebas utilizaron varios genomas, incluyendo algunos que anteriormente eran demasiado grandes para que otras herramientas pudieran manejar. El rendimiento se midió observando cuánto tiempo tardaba en procesar conjuntos de gRNAs seleccionados al azar en estos genomas.

La investigación comparó diferentes configuraciones para evaluar cuántas máscaras eran necesarias y qué pesos funcionaban mejor. A través de pruebas, las configuraciones de máscaras optimizadas mostraron promesas, reduciendo significativamente el tiempo de procesamiento. El estudio encontró que para genomas más grandes, usar un peso de máscara de diez dio los mejores resultados, mientras que los genomas más pequeños ofrecieron los mejores resultados con un peso de máscara de ocho.

Los resultados indicaron que utilizar la versión optimizada del enfoque de máscara ofrecía un rendimiento consistentemente mejor que los métodos anteriores, demostrando cómo reducir el número de secuencias a verificar puede llevar a resultados más rápidos. Los hallazgos apoyaron la idea de que conjuntos más pequeños y efectivos de máscaras podrían ser beneficiosos, especialmente dado el creciente tamaño de los datos genómicos.

A medida que los enfoques continuaron evolucionando, la necesidad de una gran memoria física se convirtió en un problema, especialmente para genomas más grandes. Esto llevó a un cambio hacia la implementación de archivos mapeados en memoria. Al usar mapeo de memoria, las herramientas podían acceder a los datos sin necesidad de cargar todo en memoria, permitiendo procesar genomas más extensos sin bloquearse o ralentizarse.

La conclusión del estudio mostró que, si bien la tecnología CRISPR ya es una herramienta poderosa para la edición del genoma, todavía hay espacio para mejoras significativas. Los avances realizados con el enfoque basado en máscaras proporcionaron un método más rápido y simplificado para evaluar los riesgos fuera del objetivo. El desarrollo de la implementación mapeada en memoria fue crucial para permitir que la herramienta escalara y funcionara de manera eficiente en diversos tamaños de genomas.

El trabajo futuro en esta área probablemente implicará optimizar aún más la velocidad y precisión de la identificación de sitios fuera del objetivo mientras se abordan las limitaciones impuestas por los tamaños de datos más grandes. En general, los hallazgos destacan la importancia de la innovación continua en herramientas y metodologías para aprovechar mejor las capacidades de la tecnología CRISPR y otros sistemas de edición del genoma.

Fuente original

Título: Fast and scalable off-target assessment for CRISPR guide RNAs using partial matches

Resumen: The design of CRISPR-Cas9 guide RNAs is not trivial. In particular, it is crucial to evaluate the risk of unintended, off-target modifications, but this is computationally expensive. To avoid a brute-force approach where each guide RNA is compared against every possible CRISPR target site in the genome, we previously introduced Crackling, a guide RNA design tool that relies on exact matches over 4bp subsequences to approximate a neighbourhood and accelerate off-target scoring by greatly reducing the search space. While this was faster than other existing tools, it still generates large neighbourhoods. Here, we aim to further reduce the search space by requiring more, now non-contiguous, exact matches. The new implementation, called Crackling++, is benchmarked against our initial approach and other off-target evaluation tools. We show that it provides the fastest way to assess candidate guide RNAs. By using memorymapped files, it also scales to the largest genomes. Crackling++ is available at https://github.com/bmds-lab/CracklingPlusPlus under the Berkeley Software Distribution (BSD) 3-Clause license.

Autores: Dimitri Perrin, C. Schmitz, J. Bradford, R. Salomone

Última actualización: 2024-02-02 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.01.578509

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.01.578509.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares