Avanços no CRISPR: Uma Nova Abordagem para os Riscos de Alvo Secundário
Métodos inovadores melhoram a precisão do CRISPR na edição do genoma e na avaliação de alvos fora do previsto.
― 8 min ler
A tecnologia CRISPR é uma ferramenta importante na edição de genomas. Ela permite que os cientistas mudem partes específicas do DNA de um organismo. Esse método usa um componente especial conhecido como nuclease associada ao CRISPR (Cas) junto com um RNA guia. O RNA guia direciona a nuclease para a área exata no DNA onde as mudanças precisam ser feitas.
Uma parte crucial desse processo é o RNA guia, ou gRNA, que pode ser modificado para atingir regiões específicas do DNA. Para um tipo de produto CRISPR, o Cas9, as áreas-alvo específicas são determinadas por uma sequência conhecida como PAM, e as 20 bases antes dela ajudam a criar o gRNA. Nos últimos dez anos, o CRISPR foi usado de várias maneiras. Os cientistas criaram modelos animais para estudar doenças, trabalharam na conservação de espécies ameaçadas, aumentaram a resistência de culturas e desenvolveram novos tratamentos.
Apesar das muitas aplicações do CRISPR, criar GRNAS eficazes é desafiador. É essencial minimizar as chances de mudanças inesperadas no genoma. Embora ter uma sequência única de 20 nucleotídeos seja crítico, não é suficiente. Às vezes, sequências que não são o alvo pretendido ainda podem ser mudadas se se parecerem muito com o gRNA. Essas mudanças indesejadas são chamadas de modificações fora do alvo, que ocorrem quando há de uma a quatro incompatibilidades na sequência.
Para lidar com os riscos fora do alvo, vários métodos foram criados para avaliar os perigos potenciais. Dois métodos bem conhecidos são o Zhang score e o Cutting Frequency Determination (CFD) score. Ambas as abordagens avaliam os gRNAs candidatos calculando pontuações que refletem como é provável que causem mudanças fora do alvo. No entanto, ambos os métodos dependem de ter uma lista completa de possíveis locais fora do alvo para um gRNA.
Isso significa que, para cada RNA guia, os cientistas devem identificar todos os possíveis locais CRISPR em todo o genoma que podem ter até quatro diferenças do RNA guia. Esse método de força bruta se torna impraticável porque grandes genomas contêm bilhões de possíveis locais CRISPR. Para enfrentar esse desafio, uma nova ferramenta chamada Crackling foi desenvolvida. O Crackling usa uma estrutura conhecida como Listas de Cortes de Assinatura Invertida (ISSL) para identificar rapidamente os possíveis locais fora do alvo sem precisar comparar cada local possível.
O ISSL funciona organizando a área de busca em partes menores. Cada local é dividido em fatias de um comprimento fixo. Por exemplo, se um local no DNA é dividido em cinco fatias, cada fatia pode ter quatro nucleotídeos de comprimento. Fazendo isso, o ISSL pode encontrar rapidamente um bairro menor de possíveis locais fora do alvo, garantindo que todos os verdadeiros locais fora do alvo sejam incluídos enquanto mantém o tamanho administrável.
Essa estrutura reduz o tempo necessário para realizar a análise. Quando as pontuações fora do alvo para um RNA guia precisam ser calculadas, o RNA guia também é dividido em fatias usando a mesma abordagem. Cada fatia é então comparada com locais próximos usando algo chamado distância de Hamming, que ajuda a identificar os locais fora do alvo. Se a distância for de quatro incompatibilidades ou menos, é confirmada como um verdadeiro local fora do alvo.
A ferramenta Crackling foi considerada significativamente mais rápida do que outras ferramentas existentes, proporcionando uma melhora notável em velocidade e eficiência. No entanto, ainda havia interesse em redesenhar a construção do bairro para torná-la ainda mais eficaz. O objetivo era obter bairros mais apertados ao redor dos gRNAs, garantindo que todos os reais locais fora do alvo fossem contados.
Reduzir o tamanho do bairro é essencial porque bairros maiores podem levar a cálculos desnecessários. Em métodos anteriores, o tamanho dos bairros poderia se tornar excessivamente grande devido à forma como os dados foram organizados. A maneira como esses arranjos foram definidos poderia levar à inclusão de muitas sequências irrelevantes. Para reduzir os tamanhos dos bairros, a nova abordagem passou de olhar para correspondências contíguas para usar arranjos não contíguos conhecidos como máscaras.
Para criar conjuntos válidos de máscaras, o objetivo era garantir que cada possível local fora do alvo tivesse pelo menos uma máscara que pudesse capturá-lo. Isso significa que precisava haver uma representação das incompatibilidades entre o RNA guia e os locais fora do alvo. Os pesquisadores conseguiram usar uma abordagem binária para representar correspondências e incompatibilidades, permitindo a verificação eficaz dos locais fora do alvo.
Para construir um conjunto inicial válido de máscaras, os pesquisadores começaram com um conjunto vazio e foram adicionando máscaras que capturassem o maior número de combinações fora do alvo. Essa abordagem gananciosa garantiu que todas as combinações fossem eventualmente capturadas, mas também resultou em conjuntos maiores do que o desejado. À medida que o tamanho do conjunto de máscaras aumentava, a memória necessária para processar os dados também aumentava. Os pesquisadores buscavam criar conjuntos menores para aliviar a pressão na memória e acelerar o processamento.
O processo de otimização envolveu a busca por conjuntos válidos de máscaras. Começando de uma coleção aleatória de máscaras, cada conjunto foi avaliado com base em sua capacidade de capturar combinações fora do alvo. Os conjuntos com melhor desempenho foram mantidos, enquanto os menos bem-sucedidos foram descartados. Esse processo continuou até que um conjunto válido fosse encontrado. Também era importante reduzir o tamanho do conjunto de máscaras, já que conjuntos maiores levavam a tempos de processamento mais longos e aumentavam as exigências de memória.
Um benchmark foi montado para testar o novo método contra versões anteriores e outras ferramentas disponíveis. Os testes usaram vários genomas, incluindo alguns que anteriormente eram grandes demais para outras ferramentas lidarem. O desempenho foi medido observando quanto tempo levou para processar conjuntos de gRNAs selecionados aleatoriamente nesses genomas.
A pesquisa comparou diferentes configurações para avaliar quantas máscaras eram necessárias e quais pesos funcionavam melhor. Através de testes, as configurações de máscara otimizadas mostraram-se promissoras, reduzindo significativamente o tempo de processamento. O estudo descobriu que, para genomas maiores, usar um peso de máscara de dez trouxe os melhores resultados, enquanto genomas menores ofereceram os melhores resultados com um peso de máscara de oito.
Os resultados indicaram que usar a versão otimizada da abordagem de máscara consistently teve um desempenho melhor do que os métodos anteriores, mostrando como reduzir o número de sequências a serem verificadas pode levar a resultados mais rápidos. As descobertas apoiaram a ideia de que conjuntos de máscaras menores e mais eficazes poderiam ser benéficos, especialmente dada a crescente quantidade de dados genômicos.
À medida que as abordagens continuavam a evoluir, a necessidade de grande memória física tornou-se um problema, especialmente para genomas maiores. Isso levou a uma mudança para a implementação de arquivos mapeados na memória. Ao usar mapeamento de memória, as ferramentas podiam acessar os dados sem precisar carregar tudo na memória, permitindo o processamento de genomas mais extensos sem travar ou desacelerar.
A conclusão tirada do estudo mostrou que, embora a tecnologia CRISPR já seja uma ferramenta poderosa para edição de genomas, ainda há espaço para melhorias significativas. Os avanços feitos com a abordagem baseada em máscaras forneceram um método mais rápido e simplificado para avaliar os riscos fora do alvo. O desenvolvimento da implementação mapeada na memória foi crucial para permitir que a ferramenta escalasse e funcionasse de forma eficiente em vários tamanhos de genomas.
Trabalhos futuros nessa área provavelmente envolverão mais otimizações na velocidade e precisão da identificação de locais fora do alvo, ao mesmo tempo em que lidam com as limitações impostas por tamanhos de dados maiores. No geral, as descobertas ressaltam a importância da inovação contínua em ferramentas e metodologias para aproveitar melhor as capacidades da tecnologia CRISPR e outros sistemas de edição de genoma.
Título: Fast and scalable off-target assessment for CRISPR guide RNAs using partial matches
Resumo: The design of CRISPR-Cas9 guide RNAs is not trivial. In particular, it is crucial to evaluate the risk of unintended, off-target modifications, but this is computationally expensive. To avoid a brute-force approach where each guide RNA is compared against every possible CRISPR target site in the genome, we previously introduced Crackling, a guide RNA design tool that relies on exact matches over 4bp subsequences to approximate a neighbourhood and accelerate off-target scoring by greatly reducing the search space. While this was faster than other existing tools, it still generates large neighbourhoods. Here, we aim to further reduce the search space by requiring more, now non-contiguous, exact matches. The new implementation, called Crackling++, is benchmarked against our initial approach and other off-target evaluation tools. We show that it provides the fastest way to assess candidate guide RNAs. By using memorymapped files, it also scales to the largest genomes. Crackling++ is available at https://github.com/bmds-lab/CracklingPlusPlus under the Berkeley Software Distribution (BSD) 3-Clause license.
Autores: Dimitri Perrin, C. Schmitz, J. Bradford, R. Salomone
Última atualização: 2024-02-02 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.02.01.578509
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.01.578509.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.