Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Genética

Avançando a Pesquisa Genética com o Método Trans-PCO

Novo método melhora a compreensão das influências genéticas em traços através de trans-eQTLs.

― 6 min ler


Trans-PCO: Um AvançoTrans-PCO: Um AvançoGenéticogenéticas mais profundas na saúde.Novo método revela influências
Índice

A pesquisa genética avançou muito, principalmente em entender como nossos genes afetam diferentes características e condições. Uma abordagem importante nessa área são os estudos de associação genômica (GWAS). Esses estudos procuram ligações entre marcadores genéticos específicos e diversas características ou doenças.

Uma descoberta impressionante desses estudos é que a maioria dos marcadores genéticos não está nas partes do nosso DNA que codificam proteínas, mas em regiões que não produzem proteínas. Esses locais não codificantes são acreditados para influenciar como os genes são expressos. No entanto, a maior parte das pesquisas existentes se concentrou em como Variantes Genéticas perto de um gene afetam a expressão desse gene, o que é conhecido como cis-regulação.

Desafios na Pesquisa Genética

Embora os efeitos cis-regulatórios sejam cruciais, eles explicam apenas uma pequena parte da base genética de muitas características e doenças. Por exemplo, um estudo mostrou que apenas cerca de 11% da variação genética em características pode ser atribuída a esses efeitos regulatórios próximos. Isso levou os cientistas a considerar os efeitos trans-regulatórios, que podem impactar genes localizados longe da variante genética.

Os efeitos trans-regulatórios podem ter impactos menores em genes individuais, mas coletivamente podem explicar uma parte mais significativa da variação nas características. Contudo, os pesquisadores enfrentam dois grandes desafios ao tentar identificar esses efeitos trans-regulatórios.

Primeiro, mapear Trans-eQTLs (que é a abreviação de loci de traço quantitativo de expressão) é propenso a erros. As sequências curtas de DNA podem ser confundidas com regiões similares do genoma, levando a conclusões incorretas. O segundo desafio é que os trans-eQTLs geralmente são mais difíceis de detectar do que seus homólogos cis, pois tendem a ter tamanhos de efeito menores.

Insights de Pesquisas Anteriores

Pesquisas mostraram que os trans-eQTLs frequentemente afetam a expressão de muitos genes. Por exemplo, em estudos com leveduras, os cientistas descobriram que um pequeno número de "hotspots" era responsável por regular um número significativo de genes. Um tema semelhante aparece em estudos humanos, onde uma grande análise de trans-eQTL identificou vários sinais que sugerem que muitas variantes genéticas afetam múltiplos genes.

Basicamente, muitas doenças são influenciadas por "reguladores mestres" que podem controlar vários genes dentro de caminhos biológicos importantes. Por exemplo, um gene ligado ao diabetes tipo 2 pode modular a expressão de vários genes envolvidos no metabolismo de lipídios.

Métodos Atuais e Suas Limitações

A maioria dos métodos atualmente utilizados não identifica diretamente trans-eQTLs associados a grupos de genes co-expressos. Em vez disso, eles focam em melhorar a detecção de cis-eQTLs ou trans-eQTLs ligados a genes únicos. Algumas abordagens tentaram levar em conta variações ocultas nos dados de trans-eQTL usando padrões de Co-expressão de genes.

Existem também várias técnicas estatísticas para captar os efeitos de grupos de genes juntos. No entanto, muitos desses métodos ainda enfrentam obstáculos significativos ao tentar detectar trans-eQTLs ligados a grupos de genes em vez de genes únicos.

Nossa Abordagem: Trans-PCO

Para lidar com esses desafios, desenvolvemos um novo método chamado trans-PCO. Essa abordagem visa encontrar trans-eQTLs conectados a grupos de genes co-expressos usando um teste de associação multivariado.

Passo Um: Pré-processamento de Dados

O primeiro passo no trans-PCO envolve limpar os dados de RNA-seq. Queremos reduzir associações incorretas de trans-eQTL que podem surgir de erros de sequenciamento. Isso significa que eliminamos leituras mapeadas para regiões genômicas difíceis antes de analisar os níveis de Expressão Gênica.

Passo Dois: Agrupando Genes

O segundo passo é agrupar os genes em clusters, o que simplifica o processo de teste. Por padrão, o trans-PCO utiliza uma técnica para identificar módulos de co-expressão com base nos dados de expressão gênica, garantindo que os grupos de genes levem em conta outros fatores que podem distorcer os resultados.

Passo Três: Testando Associações

O passo final envolve testar associações entre variantes genéticas e os níveis de expressão dos genes em cada módulo. Para isso, adaptamos um método estatístico robusto que combina as forças de vários testes, permitindo captar sinais de diferentes arquiteturas genéticas.

Resultados

Aplicamos o trans-PCO a dados de RNA-sequenciamento de um estudo relacionado à depressão, junto com dados de resumo de um grande conjunto de dados de eQTL. Nossas descobertas revelaram milhares de pares de trans-eSNP-módulo de alta qualidade associados a módulos de genes co-expressos.

Comparação com Métodos Existentes

Na detecção de trans-eQTLs, o trans-PCO superou métodos tradicionais que focavam apenas em associações de genes únicos. Nosso método foi especialmente eficaz em identificar sinais trans mais fracos, demonstrando maior poder em comparação com abordagens anteriores.

Descobertas em Módulos de Genes Co-expressos

Ao analisar, descobrimos que muitos trans-eQTLs correspondem a regiões regulatórias que afetam genes em caminhos biológicos interconectados. Por exemplo, o estudo destacou uma região regulatória específica relacionada a genes envolvidos em respostas imunes.

Também descobrimos que muitos trans-eQTLs identificados em nosso estudo tinham colocalização significativa com marcadores genéticos associados a várias características complexas.

Importância em Entender Características Complexas

Os trans-eQTLs identificados podem fornecer insights mais profundos sobre como variantes genéticas influenciam redes biológicas relacionadas a características complexas. Por exemplo, regiões regulatórias específicas que impactam respostas imunes podem ajudar a esclarecer como certos fatores genéticos contribuem para doenças autoimunes.

Explorando Validações Funcionais

Para apoiar nossas descobertas, realizamos uma anotação funcional dos módulos de genes para entender melhor como os trans-eQTLs identificados afetam processos biológicos. Essa camada adicional de análise forneceu um contexto valioso para interpretar a importância dos nossos achados.

Direções Futuras

Olhando para o futuro, nossas descobertas sugerem que o método trans-PCO poderia ser aplicado a conjuntos de dados mais amplos, proporcionando uma compreensão mais abrangente das complexas redes regulatórias em jogo. Isso poderia abrir caminhos para novas pesquisas focadas em mecanismos de doenças, alvos de tratamento e nas maneiras intrincadas como nossa genética molda os resultados de saúde.

Conclusão

O trans-PCO representa um avanço significativo na busca por entender as influências genéticas sobre características e doenças. Ao incorporar uma abordagem multivariada para detectar trans-eQTLs, podemos apreciar melhor como variantes genéticas impactam a expressão de múltiplos genes e, consequentemente, as redes biológicas envolvidas em várias condições de saúde.

Enquanto continuamos a explorar essas relações complexas, os insights obtidos podem abrir caminho para novas estratégias terapêuticas e aprimorar nossa compreensão da saúde e doença humanas.

Fonte original

Título: Trans-eQTL mapping in gene sets identifies network effects of genetic variants

Resumo: Nearly all trait-associated variants identified in GWAS are non-coding. The cis regulatory effects of these variants have been extensively characterized, but how they impact gene regulation in trans has been the subject of much fewer studies. Mapping trans genetic effects is very challenging because their effect sizes tend to be small and a large multiple testing burden reduces the power to detect them. In addition, read mapping biases can lead to many false positives. To reduce mapping biases and substantially improve power to map trans-eQTLs, we developed a pipeline called trans-PCO, which combines careful read and gene filters with a principal component (PC)-based multivariate association test. Our simulations demonstrate that trans-PCO substantially outperforms existing trans-eQTL mapping methods, including univariate and primary PC-based methods. We applied trans-PCO to two gene expression datasets from whole blood, DGN (N = 913) and eQTLGen (N = 31,684), to identify trans-eQTLs associated with gene co-expression networks and hallmark gene sets representing well-defined biological processes. In total, we identified 14,985 high-quality trans-eSNPs-module pairs associated with 197 co-expression gene modules and biological processes. To better understand the effects of trait-associated variants on gene regulatory networks, we performed colocalization analyses between GWAS loci of 46 complex traits and trans-eQTLs identified in DGN. We highlight several examples where our map of trans effects helps us understand how trait-associated variants impact gene regulatory networks and biological pathways. For example, we found that a locus associated with platelet traits near ARHGEF3 trans-regulates a set of co-expressed genes significantly enriched in the platelet activation pathway. Additionally, six red blood cell trait-associated loci trans-regulate a gene set representing heme metabolism, a crucial process in erythropoiesis. In conclusion, trans-PCO is a powerful and reliable tool that detects trans regulators of cellular pathways and networks, which opens up new opportunities to learn the impact of trait-associated loci on gene regulatory networks.

Autores: Xuanyao Liu, L. Wang, N. Babushkin

Última atualização: 2024-02-07 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2022.11.11.516189

Fonte PDF: https://www.biorxiv.org/content/10.1101/2022.11.11.516189.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes