Novo Método DendroPRS Melhora Previsões de Risco Genético
DendroPRS melhora a avaliação de risco à saúde em diversos perfis genéticos.
― 6 min ler
Índice
O campo da genética tá avançando rápido, com grandes bancos de dados de informações genéticas ficando cada vez mais comuns. Esses bancos de dados, conhecidos como biobancos, contêm dados de DNA de grupos diversos de pessoas. Um dos principais objetivos nessa área é criar métodos que consigam prever riscos de saúde e características baseado na genética de uma pessoa. Mas, os métodos atuais não funcionam igualmente bem pra todos os grupos, especialmente pra quem não é de ascendência europeia ou do Leste Asiático. Isso pode levar a resultados de saúde injustos entre as diferentes populações.
O Problema com os Métodos Atuais
A maioria dos métodos existentes pra prever pontuações de risco genético são treinados principalmente com dados de populações europeias e do Leste Asiático. Essas abordagens costumam ter dificuldades quando aplicadas a outros grupos. Tem uma quantidade menor de dados de treinamento disponíveis pra essas populações sub-representadas, o que significa que os modelos não são muito precisos pra elas. Isso levanta preocupações sobre desigualdades na saúde, já que as pessoas desses grupos podem não receber avaliações de risco precisas pra certas doenças.
Fatores que Impactam a Precisão das Previsões
Vários motivos contribuem pra má performance dos métodos atuais de previsão em populações diversas. Um deles são as diferenças em variantes genéticas, ou SNPS, que são comuns em diferentes populações. Além disso, a seleção de SNPs durante grandes estudos tende a favorecer aqueles que são mais comuns em grandes grupos de treinamento. Essas diferenças podem causar variações em quão forte o efeito de uma variante genética pode ser entre as populações.
Mudanças nos padrões de desequilíbrio de ligação, que é como as variantes genéticas são herdadas juntas, também podem dificultar previsões precisas. Esses desafios mostram a necessidade de novos métodos aprimorados que consigam levar melhor em conta a diversidade genética entre as populações.
Apresentando o DendroPRS
Pra resolver esses problemas, foi desenvolvido um novo método chamado DendroPRS. O DendroPRS é projetado pra se adaptar melhor aos dados genéticos de vários grupos de ancestralidade. Em vez de tratar cada grupo como totalmente separado, o DendroPRS considera as relações históricas entre diferentes populações. Ao reconhecer quão próximas as populações são, o DendroPRS consegue fazer previsões mais precisas sobre os tamanhos dos efeitos genéticos entre os grupos.
O DendroPRS permite que os tamanhos dos efeitos dos SNPs mudem com base na sua posição em uma árvore filogenética, que é um diagrama ramificado que mostra as relações entre diferentes populações. Essa abordagem inovadora ajuda a tornar as previsões mais confiáveis e respeita a história compartilhada desses grupos.
Validação do DendroPRS
A eficácia do DendroPRS foi testada primeiramente através de simulações. O método passou por uma série de testes pra ver como ele se saía ao ajustar os efeitos genéticos variáveis entre diferentes populações. Os resultados mostraram que o DendroPRS conseguiu manter a precisão mesmo quando as relações entre as populações eram menos diretas.
Depois disso, um teste no mundo real foi conduzido usando dados de estudos de Expressão Gênica. Essa pesquisa analisou como as variações genéticas influenciavam a expressão gênica em diferentes populações. O DendroPRS mostrou potencial ao identificar genes onde os efeitos regulatórios variavam significativamente entre os grupos, demonstrando sua capacidade de fazer previsões específicas de cada população.
Aplicação em Características Complexas
O DendroPRS também foi aplicado a características complexas usando dados do UK Biobank, que contém dados genéticos e de saúde de muitas pessoas. Esse biobanco inclui uma variedade de grupos de ancestralidade, permitindo que os pesquisadores avaliassem como o DendroPRS poderia prever várias Características de Saúde, como altura, índice de massa corporal (IMC) e níveis de colesterol.
Na análise, o DendroPRS foi comparado com métodos tradicionais que ou ajustavam um único modelo pra todas as populações ou criavam modelos personalizados pra cada população separadamente. Os resultados indicaram que o DendroPRS superou esses métodos convencionais, especialmente em características que são conhecidas por mostrar diferenças entre populações. O método foi particularmente benéfico pra grupos sub-representados, mostrando melhorias na precisão das previsões.
Descobertas e Observações
Ao longo dos estudos, várias observações importantes surgiram. O DendroPRS conseguiu distinguir casos onde as variantes genéticas tinham efeitos diferentes em características de saúde dependendo da ancestralidade da pessoa. Por exemplo, um SNP específico teve uma influência forte no IMC em alguns grupos, enquanto seu efeito foi insignificante em outros. Esse tipo de análise detalhada destaca como é importante considerar a ancestralidade ao interpretar dados genéticos.
Além disso, o DendroPRS foi eficaz em aproveitar tanto dados genéticos quanto informações adicionais, como idade e sexo, pra melhorar as previsões. Isso demonstra a flexibilidade do método em se adaptar e incorporar vários tipos de dados, potencialmente levando a avaliações de saúde mais precisas.
Implicações pra Pesquisas Futuras
A capacidade do DendroPRS de modelar com precisão os efeitos genéticos em populações diversas abre novas avenidas pra pesquisa. Estudos futuros poderiam expandir seu uso pra incluir características ainda mais complexas e conjuntos maiores de SNPs. Ao aprimorar a capacidade do modelo de lidar com mais dados genéticos, os pesquisadores poderiam obter valiosas insights sobre como a genética influencia a saúde entre diferentes pessoas.
Outra área pra possíveis melhorias envolve a aplicação de técnicas mais sofisticadas de regularização, que ajudam a evitar o overfitting. Além disso, explorar métodos pra apoiar populações admixadas poderia ainda aumentar a aplicabilidade do modelo.
Conclusão
Os desafios contínuos em prever com precisão riscos genéticos entre diferentes antecedentes ancestrais destacam uma necessidade urgente por novas metodologias. O DendroPRS representa um grande avanço nessa área ao oferecer uma abordagem mais robusta que respeita a diversidade genética das populações humanas.
Através do seu uso inovador de relações filogenéticas e sua capacidade de capturar efeitos específicos de cada população, o DendroPRS demonstra potencial tanto pra avançar a pesquisa quanto pra melhorar os resultados de saúde. Usando esse método, os cientistas podem entender melhor as complexas relações entre genética e saúde, levando, no final, a soluções de saúde mais justas e eficazes pra todos os indivíduos, independentemente de sua ancestralidade.
Título: Multi-ancestry polygenic risk scores using phylogenetic regularization
Resumo: Accurately predicting phenotype using genotype across diverse ancestry groups remains a significant challenge in human genetics. Many state-of-the-art polygenic risk score models are known to have difficulty generalizing to genetic ancestries that are not well represented in their training set. To address this issue, we present a novel machine learning method for fitting genetic effect sizes across multiple ancestry groups simultaneously, while leveraging prior knowledge of the evolutionary relationships among them. We introduce DendroPRS, a machine learning model where SNP effect sizes are allowed to evolve along the branches of the phylogenetic tree capturing the relationship among populations. DendroPRS outperforms existing approaches at two important genotype-to-phenotype prediction tasks: expression QTL analysis and polygenic risk scores. We also demonstrate that our method can be useful for multiancestry modelling, both by fitting population-specific effect sizes and by more accurately accounting for covariate effects across groups. We additionally find a subset of genes where there is strong evidence that an ancestry-specific approach improves eQTL modelling.
Autores: Mathieu Blanchette, E. Layne, S. Zabad, Y. Li
Última atualização: 2024-02-17 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.02.14.580313
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.14.580313.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.