Nova Ferramenta para Estudar o RNA da Hepatite B
O Bolero ajuda a quantificar o RNA do HBV, revelando insights sobre a infecção.
― 8 min ler
Índice
- Entendendo o HBV e Seu RNA
- Um Novo Método para Capturar RNA do HBV
- Fluxo de Trabalho do Bolero
- Etapas de Filtragem no Fluxo de Trabalho
- Determinando a Posição Inicial dos RNAs do HBV
- Variantes Spliceadas e Sua Identificação
- Validando o Bolero com Amostras Reais
- Desafios na Análise do RNA do HBV
- Comparação com Outros Estudos
- Conclusão
- Fonte original
- Ligações de referência
Cerca de 290 milhões de pessoas no mundo têm uma infecção de longo prazo com o vírus da Hepatite B (HBV). Esse vírus pode causar problemas sérios no fígado, como cirrose e câncer de fígado. Desde 1981, vacinas estão disponíveis para prevenir a infecção por HBV e sua disseminação. No entanto, os tratamentos atuais não curam a maioria dos pacientes. Uma grande razão para isso é a capacidade do HBV de se esconder no DNA do fígado em uma forma conhecida como DNA circular fechado covalentemente, ou cccDNA. Portanto, encontrar novos tratamentos que possam reduzir a atividade do cccDNA é super importante.
Pra ajudar a desenvolver esses novos tratamentos, é necessário ter bons marcadores que possam mostrar quanto HBV tá presente no fígado. Estudos recentes sugerem que medir o RNA do HBV no sangue pode ser uma forma útil de indicar quão ativa tá a cccDNA. Mas estudar essas moléculas de RNA é complicado por causa da estrutura única do HBV.
Entendendo o HBV e Seu RNA
O HBV tem um pequeno pedaço circular de DNA que tem cerca de 3,2 kilobases de comprimento. Esse DNA pode criar oito tipos principais de moléculas de RNA: preCore, pgRNA, preS1, preS2, HBs, L-HBx, M-HBx e S-HBx. Os dois tipos mais longos de RNA, pgRNA e preCore, na real são até maiores que o próprio DNA do vírus. Esses RNAS têm partes extras nas extremidades por causa de como eles são feitos por uma enzima chamada RNA polimerase II. Além disso, os RNAs menores do HBV podem se sobrepor nas suas sequências, o que dificulta estudá-los separadamente.
Os pesquisadores identificaram 22 variantes spliceadas desses tipos de RNA, chamadas de SP01 a SP22. Algumas dessas variantes spliceadas vêm do pgRNA, enquanto outras vêm do RNA preS2/HBs. Como as variantes spliceadas compartilham muitas semelhanças com os RNAs principais do HBV, descobrir qual é qual exige saber onde começam a fazer novo RNA e onde se conectam.
Um Novo Método para Capturar RNA do HBV
Recentemente, um método conhecido como amplificação rápida de extremidades de DNA complementar 5’ (5’RACE) foi desenvolvido. Essa técnica ajuda a capturar RNAs do HBV em comprimento total. Ela usa primers especiais que se ligam ao começo do RNA para isolar essas moléculas e depois faz cópias delas. Quando combinada com uma tecnologia de Sequenciamento de leitura longa, a Tecnologia Oxford Nanopore (ONT), os pesquisadores conseguem ler as sequências completas das moléculas de RNA do HBV.
Mas, analisar os dados gerados por esse sequenciamento exige um conjunto específico de ferramentas que não estão amplamente disponíveis. Pra resolver isso, uma nova ferramenta chamada Bolero foi criada. O Bolero é projetado pra avaliar os níveis de diferentes RNAs do HBV e suas variantes spliceadas. Essa ferramenta é nomeada após uma peça musical conhecida por suas partes sobrepostas, semelhante a como os transcritos do HBV são estruturados. Com o Bolero, os pesquisadores conseguem determinar as quantidades de diferentes tipos de RNA do HBV em uma amostra e possivelmente identificar novas variantes spliceadas.
Fluxo de Trabalho do Bolero
O sistema Bolero funciona como uma série de etapas pra processar dados de sequenciamento de RNA. Inicialmente, ele pode lidar com arquivos de dados brutos gerados pela ONT ou arquivos pré-processados. O fluxo de trabalho do Bolero inclui várias etapas importantes, como filtrar leituras de baixa qualidade, alinhar as sequências de RNA a um genoma de referência e identificar as posições iniciais de diferentes tipos de RNA do HBV.
Quando usando conjuntos de dados sintéticos, o Bolero mostrou resultados impressionantes em filtrar e mapear as leituras com precisão. Isso significa que os pesquisadores podem confiar nos dados produzidos por essa ferramenta pra dar uma visão clara dos níveis de RNA do HBV.
Etapas de Filtragem no Fluxo de Trabalho
Pra garantir que apenas dados de alta qualidade sejam usados, o Bolero inclui etapas de filtragem. Inicialmente, ele verifica a presença de sequências específicas que se espera no RNA do HBV. Isso ajuda a remover quaisquer leituras que não representem RNAs completos do HBV. Em uma simulação, apenas uma pequena porcentagem das leituras sintéticas passou por essas etapas de filtragem, mostrando a importância desse processo.
Uma vez que os dados são filtrados, eles são então mapeados a uma sequência de referência do RNA do HBV. Como o genoma do HBV é circular e as moléculas de RNA mais longas são maiores que o DNA do vírus, a sequência de referência precisa ser escolhida com cuidado. O RNA preCore, que inclui todos os tipos conhecidos de RNA do HBV, serve como referência para o alinhamento. O Bolero usa uma ferramenta de alinhamento chamada Minimap2 que pode reconhecer eventos de splice e identificar os tipos de RNA com precisão.
Determinando a Posição Inicial dos RNAs do HBV
Cada tipo de RNA do HBV tem uma posição inicial específica onde começa. Essa posição é crucial pra categorizar e entender os diferentes tipos de RNA. Analisando conjuntos de dados, os pesquisadores podem identificar as coordenadas iniciais de cada tipo de RNA. O desafio surge quando alguns RNAs, como preS2 e HBs, têm posições iniciais sobrepostas, tornando mais difícil diferenciá-los.
Pra resolver isso, o Bolero agrupa as leituras que caem dentro de certos intervalos de posição inicial juntas. Isso permite uma classificação mais ampla, enquanto ainda fornece uma compreensão clara dos tipos de RNA presentes. Combinando todas essas informações, os pesquisadores conseguem ver quanto de cada RNA do HBV tá presente em uma amostra.
Variantes Spliceadas e Sua Identificação
Além dos RNAs principais do HBV, também existem variantes spliceadas que os pesquisadores querem rastrear. Essas variantes têm características únicas que as diferenciam de seus tipos de RNA pai. Usando uma ferramenta de software chamada Nanosplicer, o Bolero pode identificar as junções de splicing dentro das leituras. Isso significa que as leituras contendo junções de splicing são atribuídas a variantes spliceadas específicas, enquanto as outras permanecem categorizadas sob seus principais tipos de RNA.
Entender o splicing é crucial pra ter uma visão completa do panorama do RNA do HBV. Certas variantes spliceadas são mais abundantes que outras, e saber dessas variantes pode ajudar no estudo da infecção por HBV e seus efeitos no corpo.
Validando o Bolero com Amostras Reais
Depois de testar com sucesso com dados simulados, o Bolero também foi aplicado a amostras reais coletadas de células infectadas com HBV. Os resultados demonstraram que o Bolero pode analisar e quantificar efetivamente o RNA do HBV a partir de amostras biológicas. Especificamente, o estudo encontrou que diferentes espécies de RNA do HBV estavam presentes em quantidades consistentes em várias amostras. Isso mostra que o método é confiável pra identificar e medir tipos de RNA do HBV em infecções reais.
Desafios na Análise do RNA do HBV
Estudar o RNA do HBV pode ser difícil devido à estrutura complexa do genoma do vírus. Todos os tipos de RNA do HBV compartilham algumas características comuns, o que significa que os pesquisadores frequentemente enfrentam problemas ao tentar identificar transcritos específicos. Métodos tradicionais como PCR quantitativa não são eficazes porque lutam pra distinguir entre os tipos de RNA sobrepostos.
Pra enfrentar esses desafios, os pesquisadores têm se voltado cada vez mais para tecnologias de sequenciamento de leitura longa. Essas tecnologias têm a capacidade de fornecer uma visão mais abrangente do transcriptoma do HBV, capturando e identificando com precisão as diferentes moléculas de RNA envolvidas, incluindo quaisquer variantes spliceadas.
Comparação com Outros Estudos
Outros estudos analisaram o RNA do HBV usando diferentes métodos e tecnologias. Por exemplo, alguns pesquisadores usaram técnicas pra enriquecer os RNAs do HBV a partir de amostras totais de RNA em pacientes. Outros detectaram RNAs do HBV em soro de pacientes, mas tiveram dificuldade pra quantificá-los com precisão. Essas diferenças nas metodologias podem levar a resultados variados, mesmo ao examinar tipos de RNA do HBV semelhantes.
O método Bolero se destaca porque usa conjuntos de dados sintéticos pra validar sua eficácia antes de aplicá-lo a amostras biológicas. Ele também oferece vantagens na compreensão do espectro completo dos RNAs do HBV e seus níveis.
Conclusão
O Bolero é uma ferramenta inovadora pra identificar e quantificar espécies de RNA do HBV. Integrando várias técnicas avançadas e analisando os dados de forma abrangente, o Bolero ajuda a melhorar nossa compreensão do HBV e seu comportamento em indivíduos infectados. Esse conhecimento é essencial pra desenvolver terapias eficazes e entender as complexidades dessa infecção viral persistente.
Título: Bolero: a dedicated workflow to decipher Hepatitis B virus transcriptome from long-reads sequencing method coupled to 5RACE amplification of transcripts
Resumo: Hepatitis B virus (HBV) represents a major health burden, as it affects close to 290 million people worldwide. Although prophylactic vaccines are available, current therapeutic compounds do not usually achieve HBV eradication due to the persistence of the covalently closed circular (ccc)DNA that serves as viral reservoir. Thus, novel biomarkers that reliably reflect intrahepatic cccDNA transcriptional activity would be highly relevant for the monitoring of infected individuals, as well as the evaluation of new treatments targeting HBV. In this context, the development of 5 rapid amplification of complementary DNA ends (5RACE) as a strategy to capture and amplify full-length HBV RNAs, coupled with long-read and full-length sequencing approaches (e.g., Oxford Nanopore Technology), has recently enabled the detailed characterization of these molecules. The analysis of such data requires a dedicated bioinformatics pipeline due to the highly condensed nature of the HBV genome, which is characterized by the production of multiple transcripts and spliced variants that overlap each other. Here, we present Bolero, a computational method and built-in workflow designed to handle HBV sequencing data and evaluate the relative expression of viral RNAs and their spliced variants. The analysis of HBV-infected cell lines demonstrates that our bioinformatics pipeline is efficient for the identification and quantification of individual HBV mRNAs. Thus, Bolero represents a useful tool to study cccDNA transcriptional activity and the heterogeneity of HBV RNA spliced variants. Author summaryTranscriptomic analyses have brought comprehensive insights in the mechanisms controlling gene expression. Moreover, with the recent advances in sequencing technologies and computational methods, researchers can nowadays not only quantify gene expression, but also study alternative splicing, polyadenylation, transcription initiation, and even rare phenomena such as distant gene fusions. However, conventional analysis tools still rely heavily on the assumption of linear genomes with minimal overlap between open reading frames, rendering them insufficient for studying complex viruses such as hepatitis B virus (HBV). Unlike typical linear genomes, HBV genome consists in a circular DNA molecule, which results in an extensive sequence overlap between its transcripts. To tackle these challenges, we developed an innovative approach coupling 5 rapid amplification of complementary DNA ends (5RACE) and long-read sequencing to comprehensively explore the HBV transcriptome. Furthermore, we developed Bolero, a computational method designed to handle the peculiarities of HBV sequencing data, which allows a detailed characterization of the HBV transcriptome.
Autores: Xavier Grand, G. Giraud, A. Rifki, A. Paturel, D. Bousquet, A. A. Roca Suarez, C. Bourgeois, M. Levrero, F. Zoulim, B. Testoni
Última atualização: 2024-09-21 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.09.17.613398
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.09.17.613398.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.