Melhorando o Sequenciamento de RNA com Chamada de Base Iterativa
Um novo método melhora a precisão do sequenciamento por nanoporo para análise de RNA.
― 7 min ler
Índice
- O Desafio do Basecalling
- A Importância do Sequenciamento Preciso
- Uma Nova Solução: Basecalling Iterativo
- Testando o Novo Método
- Analisando Tipos de RNA
- Análise de Vacinas de mRNA
- Inspecionando Hotspots de Modificação
- Limitações da Abordagem
- Aplicações Mais Amplas
- Produção e Purificação de BioRNAs
- Preparando para Sequenciamento
- Garantindo o Controle de Qualidade
- Conclusão
- Fonte original
- Ligações de referência
A sequenciamento por nanopore é um método usado pra ler a ordem dos blocos de construção, chamados nucleotídeos, no DNA e RNA. Esse processo funciona medindo sinais elétricos gerados quando os nucleotídeos passam por um buraco minúsculo, ou nanopore. Essa técnica ajuda os cientistas a identificar a sequência de nucleotídeos, que é crucial pra entender as informações genéticas.
Basecalling
O Desafio doBasecalling é a etapa onde os cientistas interpretam os sinais elétricos em uma sequência legível de nucleotídeos. Alguns dos métodos mais novos pra basecalling usam aprendizado profundo, que é um tipo de inteligência artificial. Exemplos desses métodos incluem Guppy, Bonito e Dorado.
Mas tem um problema significativo. A precisão desses basecallers pode ser afetada por mudanças químicas especiais nos nucleotídeos. Essas mudanças frequentemente ocorrem no DNA ou RNA natural. Por exemplo, certos tipos de RNA, como tRNA, podem ter muitas modificações que afetam a forma como são lidos. Quando isso acontece, o basecalling pode não corresponder ao que tá realmente no material genético. Isso leva a erros, como adições ou exclusões erradas ao comparar com uma sequência de referência, o que pode confundir os pesquisadores.
A Importância do Sequenciamento Preciso
Sequenciamento preciso por nanopore é vital pra várias aplicações, incluindo o desenvolvimento e controle de qualidade de vacinas. Por exemplo, Vacinas de MRNA foram modificadas pra evitar a detecção pelo sistema imunológico, melhorando sua eficácia. No entanto, essas modificações podem complicar o basecalling, levando os pesquisadores a superestimar o número de fragmentos de RNA de baixa qualidade. Isso suscita preocupações sobre se o sequenciamento por nanopore é um método confiável pra analisar RNA terapêutico.
Uma Nova Solução: Basecalling Iterativo
Pra resolver os problemas associados ao basecalling, pesquisadores desenvolveram um novo processo passo a passo chamado basecalling iterativo. Esse método começa com o basecalling inicial feito por ferramentas como Guppy e depois refina esses resultados. O processo envolve comparar os resultados iniciais a uma sequência correta conhecida, chamada verdade de base. Fazendo isso repetidamente, o objetivo é melhorar a precisão dos basecalls até que atinjam um nível satisfatório.
Testando o Novo Método
Pra testar essa abordagem de basecalling iterativo, os pesquisadores usaram sequências de RNA controle com modificações. Eles descobriram que o basecalling inicial frequentemente resultava em menor precisão de mapeamento e alinhamento comparado ao método iterativo. Através de rodadas repetidas de refinamento dos basecalls, eles observaram melhorias significativas. Os pesquisadores confirmaram que esse processo iterativo poderia produzir sequências mais precisas, livres dos artefatos causados pelo basecalling inicial.
Analisando Tipos de RNA
Os pesquisadores aplicaram a abordagem de basecalling iterativo pra analisar vários tipos de RNA. Eles se concentraram no rRNA e tRNA de levedura, que têm diferentes padrões de modificações. Ao treinar suas ferramentas de basecalling com RNA que já era conhecido, eles conseguiram melhorar a precisão do basecalling tanto pra RNA modificado quanto não modificado. Isso mostrou que até sequências sem modificações poderiam se beneficiar do processo iterativo.
Além disso, eles estudaram sequências nativas de tRNA, que são cruciais pra síntese de proteínas. O basecalling iterativo revelou alta precisão tanto pra sequências modificadas quanto padrão, indicando sua ampla aplicabilidade.
Análise de Vacinas de mRNA
Depois de confirmar a utilidade da abordagem, os pesquisadores aplicaram o basecalling iterativo pra analisar vacinas de mRNA. Eles revisitaram estudos anteriores que identificaram problemas com a detecção de transcritos truncados, que são formas mais curtas do mRNA que podem não ser eficazes. Usando seu novo método, os pesquisadores encontraram melhorias consistentes nos resultados do basecalling. O basecalling iterativo mostrou que a maioria do mRNA estava completo, confirmando a qualidade das vacinas.
Inspecionando Hotspots de Modificação
Através do basecalling preciso alcançado pela abordagem iterativa, os pesquisadores também conseguiram inspecionar áreas dentro do RNA onde modificações frequentemente ocorrem. Eles olharam especificamente pra moléculas de RNA engenheiradas chamadas BioRNAs, que são projetadas pra usos terapêuticos. Ao comparar os sinais de BioRNAs modificados com os de RNA não modificado, eles conseguiram identificar locais específicos na sequência que indicavam onde as modificações estavam presentes.
Esse tipo de inspeção detalhada é crucial pra garantir o design eficaz de moléculas terapêuticas. Os pesquisadores conseguiram identificar hotspots de modificação tanto esperados quanto inesperados. Os achados não só confirmaram a integridade dos BioRNAs, mas também forneceram insights sobre como essas modificações podem influenciar a estabilidade e eficácia das terapias de RNA.
Limitações da Abordagem
Apesar de o método de basecalling iterativo mostrar grande potencial, ele tem suas limitações. O basecalling inicial ainda precisa ser razoavelmente preciso. Se os sinais elétricos do sequenciamento por nanopore estiverem muito distorcidos por modificações, os resultados iniciais podem nunca ser confiáveis. Isso indica uma necessidade de basecallers melhorados que consigam lidar com uma gama de modificações diferentes sem perder a precisão.
Além disso, o processo depende da comparação com uma sequência de referência. Se houver diferenças entre essa referência e o RNA real que está sendo estudado, isso pode introduzir mais erros. Tais discrepâncias podem surgir de mudanças de nucleotídeos únicos que não estão incluídas nos dados de referência.
Aplicações Mais Amplas
Apesar de se concentrar nos desafios associados a nucleotídeos modificados, o método de basecalling iterativo também pode aumentar a precisão de sequências de RNA mais padrão. Isso significa que a abordagem poderia ser útil pra uma ampla gama de estudos além daqueles que focam apenas em RNA modificado. Exemplos incluem a análise de rRNAs ou tRNAs padrão, que poderiam se beneficiar da precisão aumentada proporcionada pelo processo iterativo.
Produção e Purificação de BioRNAs
A equipe de pesquisa descreveu como produziu os BioRNAs, que exigiram etapas específicas pra garantir alta qualidade. Eles começaram com sequências de tRNA humano e fizeram ajustes pra criar uma construção adequada pra uso terapêutico. Isso envolveu amplificar as sequências e, em seguida, expressá-las em E. coli. Depois de cultivar as bactérias, eles extraíram o RNA e o purificaram através de uma série de etapas de cromatografia.
Durante todo esse processo, a pureza dos BioRNAs foi monitorada de perto pra garantir sua adequação para estudos de sequenciamento por nanopore. Apenas produtos altamente homogêneos foram usados nas análises que se seguiram.
Preparando para Sequenciamento
Uma vez que o BioRNA foi purificado, o próximo passo foi prepará-lo pra sequenciamento por nanopore. Isso exigiu a construção de bibliotecas de RNA que incluíam vários adaptadores necessários pro processo de sequenciamento. Os pesquisadores seguiram um protocolo preciso, que envolveu combinar o RNA com adaptadores e ligá-los juntos pra criar uma biblioteca final pronta pra sequenciamento.
Garantindo o Controle de Qualidade
Medidas de controle de qualidade foram vitais durante todo o processo de preparação da biblioteca. Os pesquisadores tomaram cuidado pra validar a pureza e integridade do RNA em cada etapa pra evitar quaisquer problemas potenciais durante o sequenciamento. Esse planejamento cuidadoso ajudou a garantir que os dados resultantes fossem precisos e confiáveis.
Conclusão
Ler com precisão as sequências de RNA e DNA é essencial pra muitos campos, especialmente na medicina. O método de basecalling iterativo representa um avanço significativo no enfrentamento dos desafios impostos pelos nucleotídeos quimicamente modificados no sequenciamento por nanopore. Com essa abordagem, os pesquisadores podem refinar seus resultados iniciais, levando a dados mais confiáveis pra análise.
À medida que a compreensão das modificações de RNA continua a crescer, métodos de basecalling melhorados serão cruciais pra desbloquear todo o potencial do sequenciamento por nanopore. O sistema de basecalling iterativo pode abrir caminho pra uma caracterização mais precisa dos RNAs terapêuticos, beneficiando, em última análise, o desenvolvimento de novas terapias médicas.
Título: An Iterative Approach to Polish the Nanopore Sequencing Basecalling for Therapeutic RNA Quality Control
Resumo: Nucleotide modifications deviate nanopore sequencing readouts, therefore generating artifacts during the basecalling of sequence backbones. Here, we present an iterative approach to polish modification-disturbed basecalling results. We show such an approach is able to promote the basecalling accuracy of both artificially-synthesized and real-world molecules. With demonstrated efficacy and reliability, we exploit the approach to precisely basecall therapeutic RNAs consisting of artificial or natural modifications, as the basis for quantifying the purity and integrity of vaccine mRNAs which are transcribed in vitro, and for determining modification hotspots of novel therapeutic RNA interference (RNAi) molecules which are bioengineered (BioRNA) in vivo.
Autores: HONGXU DING, Z. Wang, M.-J. Tu, Z. Liu, K. K. Wang, Y. Fang, N. Hao, H. H. Zhang, J. Que, X. Sun, A.-M. Yu
Última atualização: 2024-09-18 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.09.12.612711
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.09.12.612711.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://gtrnadb.ucsc.edu/
- https://github.com/wangziyuan66/IL-AD/blob/main/scripts/trna/train_flipflop.py
- https://github.com/nanoporetech/remora/blob/master/notebooks/metrics_api.ipynb
- https://github.com/adbailey4/yeast_rrna_modification_detection/tree/main/notebooks/data
- https://github.com/novoalab/Nano-tRNAseq/tree/main/ref
- https://github.com/scchess/Mana/tree/main/data
- https://github.com/wangziyuan66/iterative-labeling-toolkit-taiyaki
- https://github.com/wangziyuan66/iterative-labeling-toolkit-bonito