Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

Otimização da Profundidade de Sequenciamento para Splicing Alternativo

Pesquisas mostram a profundidade de sequenciamento ideal pra detectar splicing alternativo em tecidos humanos.

― 7 min ler


Insights sobre aInsights sobre aProfundidade deSequenciamento Reveladoseventos de splicing em dados humanos.profundidade de sequenciamento paraPrincipais descobertas sobre a
Índice

Sequenciamento de RNA de leitura curta é um jeito de estudar como os genes podem ser cortados de formas diferentes, conhecido como Splicing Alternativo. Essa técnica é bem popular porque tem poucos erros na leitura das sequências, permite que os pesquisadores meçam quanto de cada sequência está presente e, ainda por cima, é barata. Mas, pra detectar esses Eventos de Splicing com precisão, é super importante ter uma Profundidade de Sequenciamento boa, especialmente se o objetivo é encontrar transcritos que estão em baixas quantidades. O número exato de leituras necessárias pra uma cobertura confiável do splicing alternativo em amostras humanas ainda não tá claro. Por isso, os pesquisadores precisam de diretrizes pra desenhar seus experimentos, equilibrando a profundidade do sequenciamento com o número de amostras.

Impacto da Profundidade de Sequenciamento na Detecção de Splicing Alternativo

Vários estudos já examinaram como a profundidade do sequenciamento afeta a detecção de eventos de splicing alternativo. Por exemplo, um estudo descobriu que usando 120 milhões de leituras, quase todos os eventos de exon skipping foram identificados corretamente. Mas, outras formas de splicing foram detectadas de forma menos confiável, mesmo com uma quantidade alta de leituras. Pesquisas mostram que com apenas 50 milhões de leituras, o desempenho melhora bastante à medida que o número de leituras aumenta pra 100 milhões. Alguns outros estudos sugeriram que usando um conjunto de dados simulado com 200 milhões de leituras também aumentou a detecção de eventos de splicing. No entanto, a maioria desses estudos mais antigos se baseou em dados simulados, que podem não representar totalmente a complexidade encontrada em dados biológicos reais. Além disso, muitos desses estudos testaram menos de 100 milhões de leituras, deixando perguntas sem resposta sobre a profundidade real necessária pra uma detecção abrangente do splicing.

Estudos sobre a Profundidade da Expressão Gênica

Outras pesquisas investigaram a profundidade de sequenciamento necessária pra analisar a expressão gênica, com profundidades sugeridas que vão de 200 milhões a 300 milhões de leituras para amostras humanas. Algumas estimativas indicam que uma quantidade significativa de estudos não usa sequenciamento suficiente, o que pode comprometer suas descobertas. Teve alguma investigação sobre quantos novos eventos de splicing podem ser descobertos com profundidades de sequenciamento mais altas, até um bilhão de leituras. Em estudos focados em organismos específicos, as estimativas sugerem que cerca de 68 milhões de leituras podem ser necessárias pra detectar transcritos muito raros. Considerando a complexidade do genoma humano, esse número provavelmente seria bem maior pra dados humanos.

Pesquisa em Amostras Humanas

Nossa pesquisa analisou dados de sequenciamento de RNA de vários tecidos e condições humanas, focando em amostras com mais de 500 milhões de leituras pra uma análise detalhada. A gente categorizou os níveis de expressão gênica, de baixo a alto, pra entender como a detecção varia com base na quantidade de expressão presente na amostra.

Métodos de Análise

Os conjuntos de dados de sequenciamento de RNA usados nessa pesquisa vieram de uma variedade de amostras humanas. Por exemplo, amostras de RNA de pacientes com uma variante específica do SARS-CoV-2 foram coletadas em diferentes profundidades de sequenciamento. Extraímos RNA usando métodos padrão e garantimos que a qualidade do RNA era alta antes de preparar as bibliotecas pro sequenciamento.

Cada amostra de RNA foi alinhada ao genoma humano usando software específico pra essa análise. Depois, fizemos uma contagem cuidadosa das expressões gênicas, focando nas leituras mapeadas pra determinar a profundidade do sequenciamento. Também usamos vários scripts de programação pra visualizar e analisar os dados de maneira eficaz.

Investigando Splicing Alternativo em Dados Reais

Pra analisar como a profundidade do sequenciamento influenciava a detecção de eventos de splicing, calculamos o número de genes com esses eventos em várias amostras. Classificamos os genes com base nos seus níveis de expressão e examinamos quantos foram detectados com diferentes profundidades de sequenciamento.

Descobrimos uma tendência mostrando que, à medida que a profundidade do sequenciamento aumentava, o número de eventos de splicing detectados crescia significativamente. Para genes com níveis de expressão mais baixos, uma profundidade de 150 milhões de leituras se mostrou inadequada, enquanto genes com maior expressão precisaram de cerca de 70 milhões de leituras pra encontrar um número confiável de eventos.

Analisando Amostras de Sequenciamento Profundo

Depois de examinar a coorte do SARS-CoV-2, continuamos nossa análise com outros conjuntos de dados de sequenciamento profundo. Reduzimos o tamanho dos dados pra várias profundidades pra comparar como as taxas de detecção de eventos de splicing mudaram.

Pra muitos conjuntos de dados, percebemos que aumentar o número de leituras consistentemente levou a uma melhor detecção de eventos de splicing. Mas, pra genes com maior expressão, esse aumento nos eventos detectados começou a desacelerar além de 100-150 milhões de leituras. Uma análise das amostras de tecido cardíaco confirmou ainda mais essas tendências, revelando que, embora a detecção de novos eventos continuasse, a taxa de novas descobertas estava diminuindo.

Relevância Biológica de Eventos de Splicing em Altas Profundidades

Pra entender a importância dos eventos de splicing detectados apenas em profundidades maiores de sequenciamento, investigamos os aspectos funcionais dos genes envolvidos. Alguns genes exclusivos de 200 milhões de leituras estavam conectados a respostas biológicas específicas, indicando que um sequenciamento mais profundo poderia revelar informações cruciais.

Também verificamos genes associados a doenças e encontramos alguns genes de baixa expressão que podem estar relacionados a condições cardíacas. A análise da cobertura das leituras apoiou a existência desses eventos de splicing, demonstrando que eles não eram apenas falsos positivos.

Comparando Diferentes Fontes de Dados

Comparamos conjuntos de dados de grandes projetos de pesquisa como GTEx e TCGA, que incluem muitas amostras de sequenciamento de RNA. Esses conjuntos de dados geralmente apresentam uma profundidade de sequenciamento mais baixa, sugerindo que podem perder informações importantes de splicing.

Usando os dados disponíveis, estimamos quantos eventos adicionais de splicing poderiam ser encontrados com profundidades de sequenciamento mais altas, revelando uma lacuna significativa em potenciais descobertas devido à subsequência.

Implicações de Custo da Profundidade de Sequenciamento

Fazer experimentos com profundidades extremamente altas de 200 milhões de leituras ou mais pode ser caro, o que nos levou a analisar os custos associados à detecção de eventos adicionais. Notamos uma tendência clara de que, depois de atingir cerca de 200-250 milhões de leituras, o custo pra cada detecção adicional subia rapidamente.

Com nossos resultados, propomos um limite razoável de 200 milhões de leituras pra genes de baixa expressão e um limite mais baixo pra genes de alta expressão ao estudar splicing alternativo.

Conclusão

Escolher a profundidade de sequenciamento certa é vital pra análises eficazes de sequenciamento de RNA, especialmente ao examinar splicing alternativo. Nossas descobertas indicam que a profundidade deve ser em torno de 150-200 milhões de leituras pra genes de baixa expressão, pra garantir uma detecção completa. Pra genes de alta expressão, um limite de 100-150 milhões de leituras é apropriado.

Os pesquisadores precisam ter em mente que esses limites podem variar com base na tecnologia usada, na qualidade do RNA e nas ferramentas específicas escolhidas pra análise. Nosso estudo destaca a necessidade de um sequenciamento mais profundo na pesquisa contemporânea pra capturar todo o panorama dos eventos de splicing alternativo, que pode ser significativo pra entender processos biológicos e doenças.

Eventos de splicing detectados em profundidades maiores podem conter sinais biológicos sutis que, quando considerados juntos, poderiam contribuir pra entender várias condições. Estudos futuros devem buscar profundidades de sequenciamento mais altas pra facilitar uma exploração abrangente do splicing alternativo em amostras humanas.

Fonte original

Título: RNA sequencing depth guidelines for the study of alternative splicing

Resumo: A key parameter in the experimental design of RNA-seq projects is the choice of sequencing depth. Considering a limited budget, one needs to find a tradeoff between the number of samples and the sensitivity of the analysis, particularly concerning lowly expressed genes. While previous studies have proposed a lower bound for the comprehensive analysis of differential gene expression, for the analysis of alternative splicing, it has only been proposed for human adipose tissue. However, alternative splicing differs across tissues and conditions. We analyzed publicly available and newly generated deep-sequenced paired-end RNA-seq samples (between 150 and >500 million reads, read length 50-150 bp) from human buffy coat cells and diverse sets of tissues, including gluteal subcutaneous fat, heart, and hypothalamus. Our results show that the sequencing depth typically used in published cohorts is not sufficient to comprehensively capture the landscape of alternative splicing. This motivates the use of deeper sequencing or long-read technologies in future studies. Toward this goal, we offer guidelines for choosing a suitable sequencing depth. GRAPHICAL ABSTRACT O_FIG O_LINKSMALLFIG WIDTH=200 HEIGHT=177 SRC="FIGDIR/small/617406v2_ufig1.gif" ALT="Figure 1"> View larger version (24K): [email protected]@1b3d0fborg.highwire.dtl.DTLVardef@5d15c4org.highwire.dtl.DTLVardef@140035b_HPS_FORMAT_FIGEXP M_FIG C_FIG

Autores: Olga Tsoy, S. Ameling, S. Franzenburg, M. D. Hoffmann, L. Liv-Willuth, H. K. Lee, L. Knabl, P. A. Furth, U. Voelker, L. Hennighausen, J. Baumbach, T. Kacprowski, M. List

Última atualização: 2024-10-15 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.10.09.617406

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.09.617406.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes