Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

STAR+WASP: Uma Nova Ferramenta para Pesquisa de Expressão Específica de Alelos

O STAR+WASP melhora a medição da expressão específica de alelos, lidando com o viés de mapeamento de forma eficaz.

― 6 min ler


STAR+WASP: Avançando aSTAR+WASP: Avançando aPesquisa em ASEo viés.expressão específica de alelos e reduzNovo método melhora a medição da
Índice

A Expressão específica de alelos (ASE) é quando as duas versões de um gene (chamadas de alelos) não produzem a mesma quantidade de produto nas células de uma pessoa. Essa diferença pode afetar como os traços aparecem em uma pessoa e tem implicações em áreas como diferenças genéticas, risco de doenças e como os indivíduos respondem a medicamentos.

Por que a ASE é Importante?

A ASE tem um papel importante em como os genes funcionam e interagem entre si. Pode ajudar a explicar a diversidade biológica, como as doenças se desenvolvem e por que certos tratamentos funcionam melhor para algumas pessoas do que para outras. Entender a ASE pode oferecer insights sobre a variação genética e a evolução das espécies.

Como os Cientistas Estudam a ASE?

Os cientistas usam técnicas avançadas de Sequenciamento de RNA para estudar a ASE em vários genes ao mesmo tempo. Esse método pode fornecer uma visão mais ampla da Expressão Gênica e ajudar a identificar diferenças em como os alelos são expressos.

Para medir a ASE a partir dos dados de RNA, os pesquisadores seguem uma série de etapas:

  1. Mapeamento de Leitura: Eles alinham as sequências de RNA a um genoma de referência.
  2. Identificação de Variantes: Eles encontram sequências que diferem da referência, focando naquelas que podem mostrar diferenças entre alelos.
  3. Atribuição de Leituras: Cada sequência lida é atribuída ao alelo de referência ou ao alelo alternativo.
  4. Cálculo de Desbalanceamento: Os pesquisadores calculam quanto um alelo é mais expresso em comparação com o outro.

Pesquisadores usaram esse método com sucesso em vários estudos, incluindo a investigação de diferenças na expressão gênica, como o RNA é afetado por erros e a impressão genética.

Desafios na Medição da ASE

Um grande problema ao medir a ASE a partir de dados de RNA é o viés de mapeamento. Isso acontece quando o método de alinhar sequências de RNA a um genoma de referência favorece o alelo de referência. Isso significa que sequências com formas alternativas podem não estar alinhadas corretamente. Por exemplo, quando as sequências de RNA são alinhadas a um genoma de referência, elas podem preferir incorretamente o referência em vez do alternativo, levando a medições imprecisas da expressão de alelos.

Vários métodos foram propostos para reduzir esse viés de mapeamento, como:

  • Usar genomas de consenso.
  • Usar genomas personalizados.
  • Utilizar alinhadores especiais que consideram variantes genéticas.
  • Empregar métodos baseados em grafos para alinhamento.
  • Utilizar múltiplos genomas de referência populacional.
  • Realizar uma nova montagem do genoma.

Mesmo com esses métodos, o viés de mapeamento continua sendo um obstáculo significativo na pesquisa da ASE.

Uma Nova Solução: STAR+WASP

Para resolver o problema do viés de mapeamento, foi desenvolvido um novo método chamado STAR+WASP. Essa abordagem combina as características do método WASP com o alinhador STAR RNA-seq. O método WASP tem como objetivo filtrar leituras que mostram viés de referência, mas era mais lento e complexo. A ferramenta STAR+WASP melhora o método WASP original, sendo mais rápida enquanto mantém a precisão na estimativa da ASE e minimiza o viés de referência.

Como Funciona o STAR+WASP?

O STAR+WASP segue um processo simples. Primeiro, as sequências de RNA são alinhadas ao genoma de referência. Depois, sequências que se sobrepõem a variantes conhecidas são sinalizadas. Para essas sequências sinalizadas, as informações originais dos alelos são invertidas. Se uma sequência contém a base de referência, ela é trocada pela base alternativa e vice-versa. A sequência atualizada é então realinhada ao genoma. Se essa sequência ajustada não se alinha corretamente ou se alinha incorretamente, ela é marcada como enviesada e não é incluída nos cálculos de ASE. Esse processo ajuda a minimizar os efeitos do viés de referência.

Benefícios do STAR+WASP

Ao implementar o STAR+WASP dentro do alinhador STAR, a necessidade de ler e gravar arquivos várias vezes é eliminada, acelerando o processo. Essa ferramenta também adiciona uma tag especial aos dados de saída que indica quais sequências foram filtradas com sucesso e quais não foram.

Desempenho do STAR+WASP

Em testes, os pesquisadores compararam o desempenho do STAR+WASP e o método WASP original. Foi constatado que o STAR+WASP filtrou leituras com viés de referência de forma muito eficaz. A proporção de leituras que foram rejeitadas por causa do viés variou, com certos fatores influenciando a taxa de rejeição, como o comprimento da leitura. Amostras com leituras mais longas tiveram resultados melhores do que aquelas com leituras mais curtas.

A ferramenta mostrou diminuir significativamente o viés de referência. Em amostras sem o filtragem do STAR+WASP, um viés notável foi observado, enquanto a filtragem levou a uma representação equilibrada dos alelos.

Velocidade e Eficiência

Ao analisar a velocidade e o uso de recursos, o STAR+WASP se mostrou muito mais rápido do que a abordagem original WASP. A implementação da filtragem durante o processo de alinhamento, em vez de como uma etapa separada, melhorou muito a eficiência. O uso de memória do STAR+WASP foi apenas um pouco maior do que os outros métodos, mostrando que pode operar efetivamente sem exigir recursos excessivos.

Aplicações no Mundo Real

O STAR+WASP mostrou potencial em aplicações do mundo real. Pesquisadores testaram essa ferramenta em dados de sequenciamento de RNA disponíveis publicamente, demonstrando sua capacidade de lidar efetivamente com várias populações de RNA. Tem o potencial de contribuir significativamente para a pesquisa genética, aplicações clínicas e medicina personalizada.

Conclusão

A expressão específica de alelos é um aspecto crucial da genética que ajuda a explicar variações em traços e respostas a tratamentos. O STAR+WASP é uma nova ferramenta que melhora a capacidade de medir a ASE com precisão, reduzindo o viés de mapeamento e aumentando a velocidade do processamento. Com essa ferramenta, os pesquisadores podem obter insights mais profundos sobre a expressão gênica e suas implicações na saúde e na doença. Essa inovação abre caminho para estudos genéticos mais eficazes e abordagens personalizadas na medicina, oferecendo esperança para uma melhor compreensão e tratamento de várias condições influenciadas pela genética.

Fonte original

Título: STAR+WASP reduces reference bias in the allele-specific mapping of RNA-seq reads

Resumo: SummaryAllele-specific expression (ASE) is an important genetic phenomenon that impacts an individuals phenotype and is relevant in various biological and medical contexts. Next-generation RNA sequencing technologies provide an unprecedented opportunity to measure ASE genome-wide across all heterozygous alleles expressed in a given sample. One of the major obstacles to the accurate calculation of ASE from RNA-seq data is the reference mapping bias, i.e., the preferential misalignment of the reads to the reference allele. Here, we present STAR+WASP, our reimplementation of WASP, a highly accurate algorithm for reducing the reference bias (Van De Geijn et al. 2015). We show that STAR+WASP is an order of magnitude faster than WASP while significantly reducing reference bias and providing ASE estimations similar to the original WASP algorithm. Availability and ImplementationSTAR+WASP is implemented within STAR as an integrated C++ module. STAR+WASP is open-source software, freely accessible at: http://code.google.com/p/rna-star/. [email protected] Supplementary informationSupplementary data are available at Bioinformatics online.

Autores: Alexander Dobin, R. Asiimwe

Última atualização: 2024-02-05 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.01.21.576391

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.21.576391.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes