Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Medicina genetica e genomica

O Papel dos Biomarcadores Epigenéticos nas Previsões de Saúde

Pesquisas mostram que marcadores de DNA são ferramentas para uma melhor avaliação de risco à saúde.

― 7 min ler


BiomarcadoresBiomarcadoresEpigenéticos e Risco àSaúdemelhoram previsões de risco à saúde.Estudo revela que marcadores de DNA
Índice

Está rolando um interesse crescente em usar marcadores especiais no nosso DNA, chamados biomarcadores epigenéticos, pra ajudar nos estudos de saúde. Esses marcadores podem dar informações importantes sobre coisas como gordura corporal, hábitos de fumar e consumo de álcool. Muitas vezes, as informações sobre essas características podem ser meio não confiáveis porque as pessoas podem não lembrar com precisão quando perguntadas. Usando esses marcadores de DNA, os pesquisadores esperam agrupar melhor os indivíduos com base nos riscos de saúde e prever as chances de desenvolver certas doenças.

Desafios com Dados de Metilação de DNA

Um dos principais marcadores que os caras estudam é a metilação de DNA (DNAm). Isso envolve mudanças químicas no DNA que podem afetar como os genes funcionam sem mudar a sequência de DNA em si. Porém, quando os pesquisadores coletam dados de DNAm de diferentes grupos de pessoas ou de diferentes laboratórios, pode rolar variações que dificultam a interpretação correta dos resultados.

Pra contornar isso, os cientistas tentam "normalizar" os dados, ou seja, ajustar pra levar em conta essas diferenças. Mas às vezes, esse processo pode também remover informações importantes sobre as diferenças biológicas entre os indivíduos, o que pode levar a conclusões enganosas. Quando os pesquisadores tentam combinar informações de múltiplos estudos, é crucial entender como a normalização afeta os dados.

Alguns estudos recentes mostraram que, ao aplicar diferentes Métodos de Normalização nas mesmas amostras, os resultados podem variar bastante. Isso pode dificultar pra galera da ciência garantir que suas descobertas sejam confiáveis e possam ser replicadas em diferentes populações.

Como Funcionam os Arrays de Metilação de DNA

Pra medir a DNAm, os pesquisadores costumam usar dispositivos como o Illumina Infinium HumanMethylation450 e EPIC arrays. Essas ferramentas verificam a DNAm em todo o genoma. Elas funcionam anexando sondas pequenas a locais específicos do DNA. Dependendo de estarem metilados (com um grupo metil adicionado) ou não metilados (sem o grupo metil), elas sinalizam cores diferentes pra mostrar o status do DNA.

Tem dois tipos de sondas usadas: Tipo I e Tipo II. O Tipo I usa dois segmentos curtos pra cada local de DNA, um pro estado metilado e outro pro estado não metilado. O Tipo II usa uma única sonda que pode sinalizar ambos os estados com cores diferentes.

Abordagens pra Normalizar Dados de DNAm

Os pesquisadores usam vários métodos pra normalizar os dados de DNAm. Uma técnica comum é chamada normalização por quantis (QN). Esse método ajusta os valores pra que sua distribuição seja a mesma em todas as amostras, o que ajuda a corrigir vieses causados por diferenças em como as sondas funcionam. Alguns métodos focam em correções dentro de amostras individuais, enquanto outros ajustam pra variações em múltiplas amostras.

Vários métodos de normalização específicos incluem:

  • Normalização por Quantis Dentro de Array (SWAN): Esse método foca numa seleção aleatória de sondas de DNA similares pra ajustar os valores.
  • Normalização Beta-Mixture Quantile (BMIQ): Esse método ajusta especificamente sondas do Tipo II pra igualar a distribuição das sondas do Tipo I.
  • Correção Baseada em Picos (PBC): Esse método muda as sondas do Tipo II com base nos dados das sondas do Tipo I.
  • Normal-Exponential Out-of-Band (Noob): Essa técnica corrige o ruído de fundo e vieses de cor entre as sondas.

Ao resolver problemas técnicos nos dados, os pesquisadores podem normalizar pontos de dados individuais sem precisar ajustar todos os dados anteriores juntos, o que pode ser demorado e caro.

Testando Métodos de Normalização em Coortes

Num estudo recente, os pesquisadores aplicaram diferentes métodos de normalização em dois grupos de adultos mais velhos com idades semelhantes pra descobrir quais métodos funcionavam melhor. Eles analisaram especificamente quão bem conseguiam prever o Índice de Massa Corporal (IMC) usando escores epigenéticos (EpiScores) derivados dos dados de DNAm.

Quinze métodos diferentes de normalização foram avaliados entre os dois grupos. As amostras foram coletadas de dois períodos diferentes, permitindo uma boa comparação. Depois de filtrar dados não confiáveis, eles tinham um total de 885 indivíduos pra analisar.

Avaliando o Sucesso dos Métodos de Normalização

Embora nenhum método de normalização tenha emergido como um vencedor claro, alguns se saíram melhor que outros com base em métricas específicas usadas pra avaliar sua eficácia. Métodos como "daten2" e "naten" mostraram resultados promissores no geral, enquanto outros, como o método Tost e os dados não normalizados, foram menos eficazes.

Os pesquisadores verificaram o quanto os EpiScores correlacionavam com as medições reais de IMC. Eles descobriram que as correlações médias variavam entre os dois grupos, mas o melhor método de normalização em um grupo também foi eficaz no outro.

Avaliando a Robustez da Previsão

Embora a escolha do método de normalização tenha impactado as correlações, eles também investigaram o quão consistentes eram as previsões ao usar diferentes métodos. Alguns métodos produziam EpiScores muito semelhantes para indivíduos, independentemente de o conjunto de dados ter sido processado em conjunto ou separadamente. Por exemplo, o SWAN teve um bom desempenho em ambos os grupos.

Os pesquisadores notaram que o grupo de métodos de normalização sem correções de viés de cor mostrou diferenças mais significativas nos EpiScores quando o conjunto de dados foi ajustado separadamente em comparação com quando foi combinado com uma população de referência.

Principais Conclusões e Implicações

O estudo destacou que remover ruído técnico dos dados de DNAm é essencial pra obter previsões confiáveis. Idealmente, os métodos escolhidos pra normalização devem gerar resultados consistentes, seja os dados processados sozinhos ou junto com outros conjuntos de dados. Métodos entre arrays forneceram melhores previsões ao levar em conta as correções de viés de cor, o que deve ser considerado ao aplicar esses métodos em ambientes de saúde.

Ter ferramentas eficazes de previsão de DNAm é vital pra entender melhor os riscos à saúde e desenvolver estratégias de saúde personalizadas. Os pesquisadores também apontaram que as análises de EpiScore existentes focam principalmente em como os escores diferem dentro de um grupo, mas aplicar várias abordagens de normalização pode garantir previsões confiáveis em diferentes populações.

Conclusão

Esse estudo enfatiza a importância de escolher cuidadosamente os métodos de normalização ao analisar dados de DNAm pra previsões de saúde. Os cientistas buscam fornecer ferramentas confiáveis que possam ser usadas em ambientes de saúde reais, permitindo uma melhor compreensão e previsão de características complexas de saúde, incluindo IMC. Garantindo que esses métodos sejam robustos e aplicáveis em diferentes populações, o objetivo é melhorar a pesquisa em saúde e os resultados pra os indivíduos.

Fonte original

Título: Integration of DNA methylation datasets for individual prediction

Resumo: BackgroundEpigenetic scores (EpiScores) can provide blood-based biomarkers of lifestyle and disease risk. Projecting a new individual onto a reference panel would aid precision medicine and risk communication but is challenging due to the separation of technical and biological sources of variation with array data. Normalisation methods can standardize data distributions but may also remove population-level biological variation. MethodsWe compared two independent birth cohorts (Lothian Birth Cohorts of 1921 and 1936 - nLBC1921 = 387 and nLBC1936 = 498) with DNA methylation assessed at the same chronological age (79 years) and processed in the same lab but in different years and experimental batches. We examined the effect of 15 normalisation methods on a BMI EpiScore (trained in an external cohort of 18,413 individuals) when the cohorts were normalised separately and together. ResultsThe BMI EpiScore explained a maximum variance of R2=24.5% in BMI in LBC1936 after SWAN normalisation. Although there were differences in the variance explained across cohorts, the normalisation methods made minimal differences to the estimates within cohorts. Conversely, a range of absolute differences were seen for individual-level EpiScore estimates when cohorts were normalised separately versus together. While within-array methods result in identical BMI EpiScores whether a cohort was normalised on its own or together with the second dataset, a range of differences were observed for between-array methods. ConclusionsUsing normalisation methods that give similar EpiScores whether cohorts are analysed separately or together will minimise technical variation when projecting new data onto a reference panel. These methods are especially important for cases where when raw data and joint normalisation of cohorts is not possible or is computationally expensive.

Autores: Riccardo E Marioni, C. Merzbacher, B. Ryan, T. Goldsborough, R. F. Hillary, A. Campbell, L. Murphy, A. M. McIntosh, D. Liewald, S. E. Harris, A. F. McRae, S. R. Cox, T. I. Cannings, C. A. Vallejos, D. L. McCartney

Última atualização: 2023-03-22 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2023.03.22.23287572

Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.03.22.23287572.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes