Simple Science

La science de pointe expliquée simplement

# Biologie# Génétique

Faire avancer les scores de risque polygénique avec l'algorithme TITR

Améliorer les prédictions de risque de maladie pour des populations diverses avec une nouvelle approche.

― 7 min lire


L'algorithme TITRL'algorithme TITRaméliore la prédictiondes risquespopulations diverses.du risque génétique pour desUn nouveau modèle améliore l'évaluation
Table des matières

Les Scores de Risque Polygénique (PRS) nous aident à comprendre le risque de maladies complexes en se basant sur des infos génétiques. Ces scores peuvent guider les médecins pour prendre de meilleures décisions concernant les traitements pour les personnes à haut risque, tout en réduisant les traitements inutiles pour ceux qui ont un faible risque génétique. L'efficacité des PRS dépend en grande partie d'études appelées Études d'association à l'échelle du génome (GWAS), qui analysent les données génétiques de nombreuses personnes pour trouver des liens entre génétique et maladies. Cependant, la plupart de ces études se sont concentrées sur des personnes d'ascendance européenne, ce qui limite leur utilité pour d'autres origines.

Le défi de la représentation limitée

Plus de 79 % des participants aux GWAS sont d'ascendance européenne, alors qu'ils ne représentent que 16 % de la population mondiale. Ça pose problème parce que les modèles PRS développés à partir de ces études ne fonctionnent souvent pas bien pour les personnes d'autres origines. Du coup, les modèles PRS pour ces populations sont plus faibles et moins efficaces.

Solutions pour améliorer la représentation

Il y a quelques solutions pour régler le problème de sous-représentation dans les modèles PRS. Une solution consiste à augmenter le nombre d'études génétiques incluant des personnes de divers horizons. Des projets comme le programme de recherche All of Us et la BioBank Japan s'efforcent de construire des bases de données génétiques plus inclusives. Mais ces projets coûtent cher et prennent du temps à donner des résultats, donc on a besoin de solutions plus rapides pour appliquer la médecine de précision.

Une autre approche est d'utiliser des modèles PRS trans-ancestraux. Ces modèles prennent des données solides des études GWAS européennes et les utilisent pour estimer le risque de maladie dans d'autres populations qui n'ont pas assez de leurs propres données. L'idée est que les connexions génétiques trouvées dans un groupe peuvent être appliquées à un autre, mais c'est compliqué à cause des différences dans les schémas génétiques entre les populations.

Le rôle de la Génomique fonctionnelle

Pour améliorer la précision des PRS, les chercheurs ont découvert qu'en se concentrant sur les variantes génétiques ayant des fonctions connues, on obtient de meilleurs résultats que juste en utilisant les associations statistiques les plus fortes. Ça signifie sélectionner des variantes génétiques qui ont probablement un impact direct sur le développement de la maladie. Utiliser des données de génomique fonctionnelle peut aider les chercheurs à identifier quels changements génétiques sont les plus importants.

Plusieurs modèles, comme AnnoPred et d'autres, ont combiné des données fonctionnelles avec des données GWAS pour mieux prédire les risques de maladies. Cependant, beaucoup de ces modèles se concentrent sur un seul type de cellule ou de tissu. Comme les maladies complexes impliquent souvent plusieurs tissus, une approche plus globale pourrait donner de meilleurs résultats.

L'algorithme TITR

Pour mieux identifier les changements génétiques importants à travers divers tissus, on a développé un nouveau modèle appelé l'algorithme de raffinement itératif trans-ancestral des tissus (TITR). Ce modèle privilégie les variantes génétiques pouvant avoir un impact sur plusieurs tissus, le rendant plus adaptable pour différentes populations.

L'algorithme TITR commence avec des données GWAS européennes et identifie les variantes génétiques selon leurs fonctions potentielles. Ensuite, il évalue les prédictions de risque issues de ces variantes chez des individus d'origines non européennes, ce qui aide à améliorer la précision globale.

Méthodologie pour le développement du modèle

Pour créer le modèle TITR, on rassemble des données de plusieurs ressources de génomique fonctionnelle, qui donnent des indications sur comment des changements génétiques spécifiques peuvent influencer la maladie. En se concentrant sur ces annotations fonctionnelles, on peut réduire le nombre de variantes ayant un impact significatif sur la santé.

Une fois qu'on a identifié les variantes génétiques pertinentes, on teste leur pouvoir prédictif chez des individus d'ascendance africaine. En comparant la précision des prédictions faites avec et sans ces annotations fonctionnelles, on peut mieux comprendre comment le modèle TITR fonctionne.

Prédictions améliorées avec des informations multi-tissulaires

Après avoir regardé les résultats du modèle TITR, on a découvert qu'il donne effectivement de meilleures prédictions que les méthodes précédentes qui ne prenaient en compte qu'un seul type de tissu. Par exemple, en examinant des traits qui affectent plusieurs organes-comme l'indice de masse corporelle (IMC)-le modèle TITR capture des variations de risque importantes de manière plus efficace.

Pour certaines conditions, comme les maladies coronariennes et le diabète de type 2, cibler des tissus spécifiques aide à identifier quelles variantes génétiques sont les plus importantes. Le modèle TITR excelle à reconnaître ces variantes à travers de nombreux tissus, ce qui conduit à des évaluations plus précises du risque de maladie.

Avantages de l'approche TITR

Un des principaux avantages de l'approche TITR, c'est sa capacité à identifier des variantes génétiques ayant une signification fonctionnelle à travers plusieurs tissus. Cette profondeur d'analyse permet d'obtenir une image plus claire de comment divers facteurs génétiques interagissent dans différents organes, permettant des évaluations de risque plus personnalisées.

Les résultats montrent qu'en utilisant le modèle TITR, combiné avec des informations de plusieurs tissus, on améliore effectivement les prédictions pour les individus issus de populations sous-représentées. Ça met en avant la pertinence fonctionnelle de certaines variantes génétiques plutôt que de se baser seulement sur de larges associations statistiques.

Limitations et perspectives d’avenir

Bien que le modèle TITR se soit avéré plus efficace dans divers contextes, il y a quelques limitations à considérer. On a concentré notre analyse sur des individus d'ascendance africaine venant du UK Biobank, et l'efficacité du modèle pourrait varier avec d'autres populations. De plus, les données utilisées proviennent encore principalement d'études européennes, ce qui pourrait introduire des biais dans les résultats.

Les recherches futures pourraient impliquer l'amélioration du modèle en intégrant des données provenant de populations encore plus diverses. De plus, des ajustements pour tenir compte des différences dans les schémas génétiques peuvent améliorer l'exactitude des prédictions de risque pour différents groupes.

Conclusion

L'algorithme TITR représente un pas en avant significatif dans le développement de modèles de risque polygénique qui prennent en compte des informations de génomique fonctionnelle à travers plusieurs tissus. En s'attaquant aux limites des méthodes précédentes, cette approche vise à améliorer notre capacité à prédire le risque de maladie, surtout pour les populations sous-représentées. À mesure qu'on continue à affiner ces modèles et à intégrer des données génétiques diverses, on fait des avancées concrètes vers des soins de santé plus efficaces et personnalisés.

Source originale

Titre: Enhancing Portability of Trans-Ancestral Polygenic Risk Scores through Tissue-Specific Functional Genomic Data Integration

Résumé: Portability of trans-ancestral polygenic risk scores is often confounded by differences in linkage disequilibrium and genetic architecture between ancestries. Recent literature has shown that prioritizing GWAS SNPs with functional genomic evidence over strong association signals can improve model portability. We leveraged three RegulomeDB-derived functional regulatory annotations - SURF, TURF, and TLand - to construct polygenic risk models across a set of quantitative and binary traits highlighting functional mutations tagged by trait-associated tissue annotations. Tissue-specific prioritization by TURF and TLand provide a significant improvement in model accuracy over standard polygenic risk score (PRS) models across all traits. We developed the Trans-ancestral Iterative Tissue Refinement (TITR) algorithm to construct PRS models that prioritize functional mutations across multiple trait-implicated tissues. TITR-constructed PRS models show increased predictive accuracy over single tissue prioritization. This indicates our TITR approach captures a more comprehensive view of regulatory systems across implicated tissues that contribute to variance in trait expression.

Auteurs: Alan P Boyle, B. Crone

Dernière mise à jour: 2024-02-09 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.02.07.579365

Source PDF: https://www.biorxiv.org/content/10.1101/2024.02.07.579365.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires