Faire avancer le PheWAS : La promesse de CoPheScan
CoPheScan améliore PheWAS en s'attaquant aux défis d'association des variants génétiques.
― 7 min lire
Table des matières
- Défis dans PheWAS
- La méthode CoPheScan
- Comment fonctionne CoPheScan
- Utilisation de données simulées pour tester CoPheScan
- Applications réelles de CoPheScan
- Impact de la corrélation génétique
- Aperçus des variantes génétiques spécifiques
- Limitations et travaux futurs
- Conclusion
- Source originale
- Liens de référence
Les études d'association phénotypique, ou PheWAS, examinent comment une variante génétique spécifique peut être liée à de nombreux traits ou conditions de santé différents. C'est l'opposé des études d'association à l'échelle du génome (GWAS), qui examinent généralement de nombreuses variantes pour leur lien avec un seul trait. PheWAS a pris de l'ampleur car les grosses biobanques ont plein de traits ou de conditions de santé liés aux données génétiques, ce qui rend ces études possibles.
PheWAS est particulièrement utile dans le domaine de la Pharmacogénomique, qui étudie comment les gènes influencent la réponse d'une personne aux médicaments. Ça peut aider à trouver de nouvelles utilisations pour des médicaments existants et à identifier des effets secondaires potentiels en reconnaissant quand une variante génétique affecte plusieurs traits. Les chercheurs combinent souvent PheWAS avec d'autres méthodes, comme la randomisation mendélienne, pour déterminer si certaines expositions entraînent réellement des résultats spécifiques ou si c'est juste par chance.
Défis dans PheWAS
Les méthodes actuelles de PheWAS se concentrent principalement sur une variante génétique à la fois et peuvent passer à côté des connexions entre des variantes génétiques proches dans le génome. Ces variantes voisines peuvent créer de la confusion, rendant difficile de savoir si une association détectée avec un trait est vraiment due à la variante étudiée ou à une autre à proximité. Par exemple, des chercheurs étudiant le UK Biobank ont trouvé un lien entre une variante spécifique et le cholestérol élevé. Mais ils se sont ensuite rendu compte que ce lien provenait d'une autre variante proche déjà connue pour influencer les niveaux de cholestérol. Ça montre bien qu'il y a besoin de tests de suivi pour confirmer si les associations sont vraiment causées par les variantes étudiées.
La méthode CoPheScan
Pour relever ces défis, une nouvelle méthode a été développée, appelée CoPheScan. Cette approche bayésienne permet aux chercheurs de tester les connexions entre de nombreux traits et variantes génétiques tout en gérant la confusion possible causée par les variantes voisines. CoPheScan peut utiliser des données supplémentaires, comme les relations génétiques entre différents traits, pour améliorer la précision de ses résultats. Elle peut aussi s'adapter à diverses situations, selon que des données détaillées sur les variantes voisines sont disponibles.
CoPheScan se distingue des méthodes précédentes en examinant plusieurs variantes en même temps et en apprenant des données de manière hiérarchique. Plutôt que de supposer que les probabilités antérieures pour les associations sont fixes, elle ajuste ces probabilités en fonction des informations disponibles. Cette flexibilité permet à la méthode d'être plus efficace et précise.
Comment fonctionne CoPheScan
Quand les chercheurs utilisent CoPheScan, ils commencent par une variante qu'ils savent liée à un trait spécifique. Ensuite, ils cherchent d'autres traits qui pourraient aussi être liés à cette variante. La méthode évalue si les motifs génétiques pour deux traits suggèrent qu'ils partagent une cause commune.
CoPheScan fonctionne sur trois hypothèses de base :
- Pas d'association : Aucune variante n'est liée au trait étudié.
- Association avec une autre variante : Le trait est lié à une variante différente à proximité, pas celle étudiée directement.
- Association directe : Le trait est directement lié à la variante étudiée.
En évaluant ces hypothèses, CoPheScan peut identifier de vraies associations entre variantes génétiques et traits tout en minimisant les erreurs des variantes voisines.
Utilisation de données simulées pour tester CoPheScan
Les chercheurs ont testé CoPheScan en simulant des données pour voir comment elle se comparait aux méthodes standards. Ils ont généré des données fictives avec différents scénarios, comme une ou deux variantes causales influençant les traits. Les résultats ont montré que CoPheScan était meilleure pour garder les faux positifs bas par rapport aux méthodes traditionnelles, qui rapportaient souvent des associations incorrectes à cause de la confusion entre les variantes voisines.
Dans leurs tests, CoPheScan a montré des taux contrôlés de faux positifs tout en montrant une sensibilité aux véritables associations. Ils ont trouvé que quand deux variantes causales étaient présentes, CoPheScan performait toujours bien, détectant les bonnes associations plus efficacement que les approches standards.
Applications réelles de CoPheScan
Après avoir établi l’efficacité de CoPheScan, les chercheurs l'ont appliquée pour analyser des données réelles du UK Biobank, explorant les liens causals entre divers traits et variantes génétiques. Ils ont examiné des variantes connues pour être associées à des maladies, utilisant l'outil pour identifier d'autres traits au sein du UK Biobank qui pourraient être corrélés avec ces variantes.
Leurs résultats ont révélé de nombreuses associations. Par exemple, ils ont remarqué que certaines variantes liées au diabète de type 2 étaient aussi liées aux médicaments utilisés pour traiter la condition. Ça montre comment CoPheScan peut fournir des informations sur les relations entre Variants génétiques et résultats de santé, aidant potentiellement dans le développement de médicaments et la médecine personnalisée.
Impact de la corrélation génétique
Dans certaines analyses, les chercheurs ont intégré des données sur la corrélation génétique entre les traits pour améliorer la performance de CoPheScan. Cette étape leur a permis d'obtenir de meilleures informations en reconnaissant la relation entre divers traits. Ils ont trouvé que l'inclusion de cette corrélation génétique améliorait l'identification des associations entre variantes et traits.
Par exemple, les variantes liées au diabète de type 2 montraient des associations plus fortes avec certains médicaments quand les données de corrélation génétique étaient prises en compte. Ça souligne l'importance d'utiliser des informations supplémentaires pour guider les analyses dans les études génétiques.
Aperçus des variantes génétiques spécifiques
Les chercheurs ont utilisé CoPheScan pour étudier des variantes individuelles et leurs associations avec des conditions de santé. Par exemple, ils ont examiné certaines variantes connues pour influencer les maladies médiées par le système immunitaire. Ils ont découvert que certaines variantes étaient liées à plusieurs conditions, soulignant les interactions complexes entre gènes et traits.
Dans un cas impliquant un gène associé aux maladies auto-immunes, ils ont découvert que la même variante était liée à différentes conditions liées au système immunitaire. Ces résultats illustrent comment CoPheScan peut révéler des relations entre variantes génétiques et divers problèmes de santé, aidant à mieux comprendre les mécanismes des maladies.
Limitations et travaux futurs
Malgré ses forces, CoPheScan a des limites. Par exemple, son efficacité dépend d'avoir des données précises sur les relations entre les variantes voisines. À mesure que les chercheurs continuent d'explorer les associations génétiques, les avancées technologiques et la disponibilité des données aideront à améliorer l'exactitude et l'applicabilité de méthodes comme CoPheScan.
Les chercheurs prévoient de peaufiner l'approche CoPheScan, afin de lui permettre d'analyser des données provenant de plusieurs populations et de mieux gérer les cas avec des variantes rares. En élargissant ses capacités, l'objectif est d'améliorer la performance et l'utilité de l'outil dans diverses études.
Conclusion
PheWAS fournit une approche précieuse pour comprendre les connexions entre variantes génétiques et traits de santé. La nouvelle méthode CoPheScan renforce ce domaine en offrant un moyen d'analyser les associations de manière plus précise, en tenant compte de la confusion potentielle des variantes voisines. À mesure que les chercheurs explorent les relations entre gènes et traits, des outils comme CoPheScan joueront un rôle crucial dans l'avancement de notre compréhension de la santé et des maladies humaines.
Titre: CoPheScan: phenome-wide association studies accounting for linkage disequilibrium
Résumé: Phenome-wide association studies (PheWAS) facilitate the discovery of associations between a single genetic variant with multiple phenotypes. For variants which impact a specific protein, this can help identify additional therapeutic indications or on-target side effects of intervening on that protein. However, PheWAS is restricted by an inability to distinguish confounding due to linkage disequilibrium (LD) from true pleiotropy. Here we describe CoPheScan (Coloc adapted Phenome-wide Scan), a Bayesian approach that enables an intuitive and systematic exploration of causal associations while simultaneously addressing LD confounding. We demonstrate its performance through simulation, showing considerably better control of false positive rates than a conventional approach not accounting for LD. We used CoPheScan to perform PheWAS of protein-truncating variants and fine-mapped variants from disease and pQTL studies, in 2275 disease phenotypes from the UK Biobank. Our results identify the complexity of known pleiotropic genes such as APOE, and suggest a new causal role for TGM3 in skin cancer.
Auteurs: Ichcha Manipur, G. Reales, J. H. Sul, M. K. Shin, S. Longerich, A. Cortes, C. Wallace
Dernière mise à jour: 2024-05-31 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2023.06.29.546856
Source PDF: https://www.biorxiv.org/content/10.1101/2023.06.29.546856.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.nealelab.is/uk-biobank/
- https://www.finngen.fi/en/access_results
- https://broad-ukb-sumstats-us-east-1.s3.amazonaws.com/round2/annotations/variants.tsv.bgz
- https://www.nealelab.is/uk-biobank
- https://broad-alkesgroup-ukbb-ld.s3.amazonaws.com/UKBB_LD15
- https://ukbb-rg.hail.is/
- https://ftp.ncbi.nlm.nih.gov/hapmap/recombination/2011-01_phaseII_B37/
- https://cran.r-project.org/package=cophescan
- https://ichcha-m.shinyapps.io/cophescan-app/
- https://github.com/ichcha-m/cophescan-app
- https://github.com/chr1swallace/cophescan-manuscript-sim-summary-data
- https://github.com/ichcha-m/cophescan-paper
- https://broad-alkesgroup-ukbb-ld.s3.amazonaws.com/UKBB_LD
- https://www.ebi.ac.uk/gwas/
- https://www.decode.com/summarydata/
- https://platform.opentargets.org/downloads
- https://gnomad.broadinstitute.org/downloads
- https://go.drugbank.com/drugs/