O Papel das Pontuações Poligênicas na Previsão de Risco à Saúde
Escores poligênicos ajudam a estimar o risco de doenças usando informações genéticas.
― 8 min ler
Índice
- O Processo de Criação dos PGS
- A Importância Crescente dos PGS
- Diferentes Métodos pra Calcular PGS
- Um Novo Fluxo de Trabalho: Prspipe
- Avaliação dos Métodos de PGS
- Os Resultados das Avaliações de PGS
- A Importância do Pareamento de Ancestralidade
- O Papel da Validação cruzada no Desenvolvimento dos PGS
- Desafios na Pesquisa de PGS
- Direções Futuras pra Pesquisa de PGS
- Conclusão
- Fonte original
- Ligações de referência
Scores poligênicos (PGS) são ferramentas usadas pra estimar o risco de uma pessoa desenvolver certas doenças com base na sua genética. Esses scores são calculados analisando várias pequenas variações genéticas no genoma e combinando os efeitos delas. Estudos que avaliam várias variantes genéticas ao mesmo tempo, conhecidos como estudos de associação genômica (GWAS), tornaram possível criar esses scores. Usando PGS, os pesquisadores conseguem melhorar modelos tradicionais que preveem o risco de doenças, que geralmente dependem do histórico familiar e biomarcadores conhecidos.
O Processo de Criação dos PGS
O processo de criação dos PGS envolve duas etapas principais. A primeira etapa usa dados disponíveis publicamente pra calcular os scores. Nessa fase, os pesquisadores reúnem informações sobre variantes genéticas associadas a características ou doenças específicas. Eles ajustam os scores com base em como essas variantes se correlacionam. Esse ajuste é importante porque algumas variantes podem estar relacionadas, e o efeito combinado delas precisa ser considerado. Existem vários métodos pra esse ajuste, que incluem técnicas estatísticas que ajudam a refinar as estimativas da contribuição de cada variante pro risco de doença.
A segunda etapa exige acesso a dados individuais, como informações genéticas específicas e registros de saúde, pra pontuar indivíduos usando esses pesos derivados. Essa abordagem permite que os pesquisadores calculem o risco pra cada pessoa com base nas suas características genéticas únicas.
A Importância Crescente dos PGS
Nos últimos anos, os PGS ganharam popularidade pelas suas aplicações potenciais na medicina personalizada. Esses scores podem ajudar em estratégias de prevenção de doenças, auxiliar em testes clínicos e guiar decisões de tratamento. Os pesquisadores estão interessados em integrar os PGS com outras informações relacionadas à saúde pra criar avaliações de risco mais precisas.
Apesar do potencial dos PGS, existem limitações. Muitos estudos que comparam diferentes métodos de PGS costumam usar apenas algumas características ou conjuntos de dados. Isso pode não representar completamente como esses métodos funcionam em cenários reais, onde os dados podem ser bagunçados e menos organizados.
Diferentes Métodos pra Calcular PGS
Vários métodos foram desenvolvidos pra calcular os pesos dos PGS a partir de dados de GWAS. Esses métodos não precisam de acesso direto a dados individuais, que muitas vezes são restritos por questões de privacidade. Em vez disso, eles usam estatísticas sumárias que agregam descobertas de estudos maiores.
Ao criar PGS, os pesquisadores precisam escolher parâmetros ou configurações apropriadas pros seus modelos. Alguns métodos permitem configurações automáticas que não exigem dados de participantes, enquanto outros podem usar dados existentes pra definir os melhores parâmetros de pontuação.
Um Novo Fluxo de Trabalho: Prspipe
Pra simplificar o processo de cálculo dos PGS, um fluxo de trabalho chamado prspipe foi desenvolvido. Esse fluxo pode rodar automaticamente múltiplos métodos de PGS com base nas estatísticas sumárias de GWAS. Ele incorpora várias técnicas em uma única estrutura que os pesquisadores podem usar de forma fácil.
O fluxo de trabalho facilita a análise processando estatísticas sumárias, rodando cálculos de PGS e harmonizando dados genéticos de diferentes fontes. Isso significa que os pesquisadores podem usar esse fluxo pra produzir resultados mais consistentes e confiáveis, o que ajuda na avaliação e comparação de diferentes métodos de PGS.
Avaliação dos Métodos de PGS
Um aspecto importante do uso de PGS é entender o quão bem diferentes métodos funcionam. Avaliações mostraram que diferentes métodos de pontuação podem produzir resultados variados, e alguns scores podem ter um desempenho melhor pra certas características do que outros. Ao realizar avaliações em múltiplos conjuntos de dados e biobancos, os pesquisadores podem obter insights sobre as forças e fraquezas de cada método de PGS.
Em uma avaliação grande, pesquisadores compararam o desempenho de vários métodos de PGS em diferentes características. Eles focaram em dois grupos de ancestralidade principais: europeu e sul-asiático. Ao olhar para o desempenho dos PGS em diversos biobancos, os pesquisadores puderam analisar como os scores variavam dentro e entre diferentes grupos.
Os Resultados das Avaliações de PGS
Os resultados das avaliações indicaram que há uma variação considerável no desempenho dos PGS entre diferentes métodos. Enquanto alguns métodos produziam resultados fortes consistentemente, outros tinham sucesso limitado, especialmente quando aplicados a certas características ou conjuntos de dados. A avaliação enfatizou a necessidade de múltiplos métodos pra avaliar a confiabilidade dos PGS antes de aplicá-los em cenários do mundo real.
Curiosamente, o método de PGS ensemble, que combina scores de vários métodos, tende a ter um desempenho melhor do que métodos individuais no geral. Isso indica que usar uma combinação de scores pode fornecer uma estimativa mais robusta do risco de doença, ao invés de depender de um único método.
A Importância do Pareamento de Ancestralidade
Um fator essencial pro sucesso dos PGS é garantir que os dados genéticos usados estejam alinhados com a população que está sendo estudada. O pareamento de ancestralidade é crucial porque a variação genética pode diferir significativamente dentro das populações. Se os dados de referência genética usados pra criar os PGS não combinarem com a ancestralidade dos indivíduos sendo pontuados, os resultados podem ser menos precisos.
Nas avaliações, os pesquisadores se preocuparam em parear dados genéticos com base na ancestralidade. Essa prática melhorou a confiabilidade da análise, resultando em melhores estimativas de risco de doença. Também destacou o fato de que o desempenho dos PGS pode variar dependendo do histórico genético dos indivíduos envolvidos.
Validação cruzada no Desenvolvimento dos PGS
O Papel daValidação cruzada é uma técnica usada pra avaliar como um modelo funciona bem ao dividir os dados em subconjuntos. Os pesquisadores podem usar parte do conjunto de dados pra treinar o modelo e a outra parte pra avaliar seu desempenho. Esse processo é particularmente importante no desenvolvimento dos PGS, pois ajuda a identificar os melhores parâmetros de pontuação enquanto mitiga o risco de overfitting do modelo a dados específicos.
As avaliações mostraram que usar validação cruzada frequentemente levava a um desempenho melhor em PGS comparado a usar ajuste automático. Isso permitiu que os pesquisadores ajustassem seus modelos com base nas especificidades dos dados, resultando em previsões de risco mais precisas.
Desafios na Pesquisa de PGS
Apesar do progresso nas metodologias de PGS, os pesquisadores ainda enfrentam vários desafios. Um problema significativo é a variabilidade no desempenho entre biobancos e métodos. Diferenças em como as doenças são diagnosticadas, variações nas estruturas populacionais e inconsistências na coleta de dados genéticos podem impactar a precisão dos PGS.
Além disso, o cenário da pesquisa genética está mudando constantemente, com novos métodos e ferramentas sendo desenvolvidos regularmente. Como resultado, acompanhar os últimos avanços e integrar isso em estruturas existentes pode ser desafiador.
Direções Futuras pra Pesquisa de PGS
À medida que os PGS continuam ganhando espaço na medicina personalizada, os pesquisadores estão ativamente buscando maneiras de aumentar sua confiabilidade e aplicabilidade. Há uma necessidade crescente por métodos padronizados e formatos de dados que facilitem comparações entre diferentes abordagens de PGS.
Além disso, os pesquisadores visam melhorar os cálculos de PGS incorporando populações mais diversas em seus estudos. Isso pode ajudar a garantir que os métodos de PGS sejam aplicáveis em várias origens genéticas e reduzir disparidades nos resultados de saúde.
Conclusão
Scores poligênicos representam um passo significativo rumo à compreensão das influências genéticas na saúde e nas doenças. Ao combinar informações genéticas com dados de saúde, os pesquisadores podem prever melhor os riscos individuais e adaptar estratégias de prevenção de acordo. No entanto, a complexidade dos dados genéticos e a variabilidade entre diferentes métodos de pontuação exigem testes e avaliações rigorosas.
À medida que o campo da genética avança, a integração dos PGS na prática clínica promete aumentar nossa compreensão sobre os riscos de doenças, levando a soluções de saúde mais personalizadas e eficazes. Com pesquisa e colaboração contínuas, os potenciais benefícios dos PGS podem ser plenamente realizados, abrindo caminho pra uma nova era na medicina.
Título: Evaluation of polygenic scoring methods in five biobanks reveals greater variability between biobanks than between methods and highlights benefits of ensemble learning
Resumo: Methods to estimate polygenic scores (PGS) from genome-wide association studies are increasingly utilized. However, independent method evaluation is lacking, and method comparisons are often limited. Here, we evaluate polygenic scores derived using seven methods in five biobank studies (totaling about 1.2 million participants) across 16 diseases and quantitative traits, building on a reference-standardized framework. We conducted meta-analyses to quantify the effects of method choice, hyperparameter tuning, method ensembling and target biobank on PGS performance. We found that no single method consistently outperformed all others. PGS effect sizes were more variable between biobanks than between methods within biobanks when methods were well-tuned. Differences between methods were largest for the two investigated autoimmune diseases, seropositive rheumatoid arthritis and type 1 diabetes. For most methods, cross-validation was more reliable for tuning hyperparameters than automatic tuning (without the use of target data). For a given target phenotype, elastic net models combining PGS across methods (ensemble PGS) tuned in the UK Biobank provided consistent, high, and cross-biobank transferable performance, increasing PGS effect sizes ({beta}-coefficients) by a median of 5.0% relative to LDpred2 and MegaPRS (the two best performing single methods when tuned with cross-validation). Our interactively browsable online-results (https://methodscomparison.intervenegeneticscores.org/) and open-source workflow prspipe (https://github.com/intervene-EU-H2020/prspipe) provide a rich resource and reference for the analysis of polygenic scoring methods across biobanks.
Autores: Remo Monti, L. Eick, G. Hudjashov, K. Läll, S. Kanoni, B. N. Wolford, B. Wingfield, O. Pain, S. Wharrie, B. Jermy, A. McMahon, T. Hartonen, H. O. Heyne, N. Mars, Genes & Health Research Team, K. Hveem, M. Inouye, D. A. van Heel, R. Mägi, P. Marttinen, S. Ripatti, A. Ganna, C. Lippert
Última atualização: 2023-11-20 00:00:00
Idioma: English
Fonte URL: https://www.medrxiv.org/content/10.1101/2023.11.20.23298215
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.11.20.23298215.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://methodscomparison.intervenegeneticscores.org/
- https://github.com/intervene-EU-H2020/GenoPred
- https://methodscomparison.intervenegeneticscores.org
- https://github.com/intervene-EU-H2020/prspipe/blob/main/resources/1kg/1KGPhase3_hm3_hg19_hg38_mapping_cached.tsv.gz
- https://github.com/intervene-EU-H2020/prspipe/blob/main/workflow/rules/1kg_hm3_processing.smk
- https://github.com/intervene-EU-H2020/prspipe/blob/main/workflow/rules/genotype_harmonization.smk
- https://hunt-db.medisin.ntnu.no/hunt-db/variablelist
- https://github.com/MathiasHarrer/dmetar/blob/master/R/mlm.variance.distribution.R
- https://github.com/intervene-EU-H2020/prspipe
- https://zenodo.org/doi/10.5281/zenodo.10012995
- https://github.com/intervene-EU-H2020/pgsCompaR
- https://github.com/intervene-EU-H2020/pgs-method-compare
- https://www.ebi.ac.uk/gwas/