Avancées dans les modèles GWAS pour la recherche génétique
De nouveaux modèles améliorent l'étude de la génétique et des traits à travers les populations.
― 7 min lire
Table des matières
Ces dernières années, les scientifiques ont fait des avancées majeures dans la façon dont on peut étudier l'information génétique de divers êtres vivants. Ces progrès ont permis aux chercheurs de rassembler rapidement une énorme quantité de données sur des génomes entiers, et à moindre coût qu'avant. Cela a conduit à des études plus efficaces qui explorent la relation entre la génétique et différents traits ou maladies.
Une méthode importante utilisée pour étudier ces relations s'appelle les études d'association à l'échelle du génome (GWAS). Initialement utilisée pour étudier la génétique humaine, cette méthode a été étendue pour examiner la génétique chez les plantes et les animaux aussi. Le travail dans ce domaine évolue rapidement, grâce aux nouvelles technologies de séquençage qui fournissent des données génomiques détaillées.
Qu'est-ce que le GWAS ?
Le GWAS consiste à chercher des liens entre des variations génétiques spécifiques et des traits observables. Par exemple, les scientifiques pourraient vouloir découvrir pourquoi certaines plantes poussent plus haut que d'autres ou pourquoi certains animaux peuvent avoir des couleurs différentes. Pour cela, les chercheurs collectent des données génétiques d'un groupe d'individus, qui pourrait provenir de diverses populations.
Lors de l'analyse des données, il est crucial de garder à l'esprit que les populations sont diverses. Différents groupes peuvent avoir des antécédents génétiques uniques qui peuvent influencer les résultats. Si cette diversité n'est pas suffisamment prise en compte, cela pourrait mener à des conclusions incorrectes sur quels gènes influencent certains traits.
Types de QTLs
Les régions génétiques qui affectent les traits s'appellent des loci de traits quantitatifs (QTLs). Cependant, il est essentiel de reconnaître que tous les QTLs ne se comportent pas de la même manière selon les différents milieux. Certains QTLs peuvent n'avoir d'effets que dans des populations spécifiques, ce qui les rend uniques ou spécifiques à un groupe.
Par exemple, si des scientifiques étudient un trait spécifique comme la hauteur des plantes, ils pourraient découvrir que certains gènes influencent cette hauteur différemment selon le background génétique de la plante. Ces interactions complexes peuvent être causées par divers facteurs, comme la façon dont les gènes interagissent entre eux et la présence de diverses mutations dans des populations spécifiques.
Défis des GWAS traditionnels
Traditionnellement, les modèles de GWAS ont supposé que les effets des QTLs demeurent les mêmes à travers différents milieux génétiques. Pourtant, en réalité, ces effets peuvent varier considérablement. Certains chercheurs ont développé des méthodes pour aborder ce problème, y compris des modèles pour tenir compte des QTLs spécifiques à des populations.
Une de ces approches consiste à créer un modèle capable de détecter ces QTLs uniques. Un exemple est un modèle qui prend en compte comment l'effet de chaque marqueur génétique peut dépendre de son ascendance et de la population spécifique dans laquelle il est étudié.
Limites des modèles actuels
Malgré les avancées dans le modélisation des effets spécifiques aux populations, beaucoup de méthodes actuelles s'appuient fortement sur des informations préalables concernant la structure des populations. Cela signifie que les chercheurs doivent souvent avoir une compréhension claire des arrière-plans génétiques avant d'appliquer ces modèles. Malheureusement, cela peut constituer un obstacle dans les études où ces informations ne sont pas disponibles, surtout quand on s'occupe de populations ayant une structure génétique plus subtile et continue.
Dans la nature, les populations peuvent présenter une variation génétique continue, ce qui signifie que les individus peuvent montrer une gamme de traits génétiques plutôt que des séparations claires en groupes. Cela rend difficile l'application efficace des méthodes GWAS standards, car elles peuvent ne pas capter pleinement les complexités présentes dans les populations naturelles.
Nouvelles approches du GWAS
Pour surmonter ces limitations, deux nouveaux modèles ont été développés. Le premier s'appelle le modèle SNPxGB, qui prend en compte l'interaction entre des marqueurs génétiques spécifiques et l'arrière-plan de la population. Le second est le modèle HBxGB, qui se concentre sur les interactions avec des régions plus larges de données génétiques connues sous le nom de blocs haplotypiques, et comment elles pourraient changer à travers une structure génétique continue.
Ces modèles visent à fournir un cadre plus flexible pour étudier les traits génétiques sans nécessiter de connaissances préalables sur la structure des populations. En reconnaissant que les interactions entre les marqueurs génétiques et leurs arrière-plans peuvent influencer les résultats des traits, ces modèles permettent de mieux comprendre comment les gènes contribuent aux caractéristiques observables.
Comment fonctionnent les modèles
Le modèle SNPxGB inclut explicitement des termes d'interaction entre les marqueurs génétiques et la structure de la population. Cela signifie que lorsque les chercheurs étudient un marqueur spécifique, ils peuvent aussi considérer comment son effet peut varier selon l'arrière-plan génétique des populations.
Le modèle HBxGB pousse ce concept plus loin en incorporant des interactions de blocs haplotypiques. Les blocs haplotypiques sont des régions du génome d'un individu qui sont héritées ensemble. En incluant cette couche supplémentaire de complexité, le modèle HBxGB offre des perspectives avancées sur la façon dont différents éléments génétiques interagissent au sein de milieux variés.
Évaluation des nouveaux modèles
Pour tester l'efficacité de ces nouveaux modèles, les chercheurs ont réalisé des simulations en utilisant des données génétiques réelles. Ils ont examiné dans quelle mesure chaque modèle pouvait contrôler les faux positifs-des erreurs où un trait semble lié à un gène alors qu'il ne l'est pas-et à quel point ils pouvaient détecter différents types de QTLs.
Les résultats de ces évaluations ont indiqué que les nouveaux modèles étaient efficaces pour contrôler les faux positifs et détecter les QTLs dans divers scénarios. Par exemple, les deux modèles ont bien performé pour identifier des QTLs communs mais ont montré des différences dans leur capacité à détecter les QTLs spécifiques à des populations ou interagissant avec des structures génétiques continues.
Applications dans le monde réel
Les nouveaux modèles ont également été appliqués à de véritables données Phénotypiques, en examinant des traits tels que la teneur en huile et en protéines dans les soja. Les résultats ont illustré comment les modèles GWAS peuvent se compléter. Différents modèles ont détecté divers marqueurs génétiques, mettant en avant l'importance d'utiliser plusieurs approches dans l'étude de traits complexes.
Conclusion
Le développement des modèles SNPxGB et HBxGB représente un pas important en avant dans la recherche génétique. Ils permettent aux chercheurs d'étudier comment les traits génétiques interagissent avec les structures de population sans avoir besoin d'informations préalables.
En utilisant ces méthodes, les scientifiques peuvent découvrir les mécanismes génétiques sous-jacents à divers traits, ce qui a des implications critiques pour l'agriculture, la médecine et l'écologie. Le travail se poursuit, et les recherches futures devraient prolonger ces modèles encore plus, fournissant plus d'aperçus sur les relations complexes entre gènes et traits.
Titre: Development of a novel GWAS method to detect QTL effects interacting with the discrete and continuous population structure
Résumé: Although GWAS has been a key technology to identify causal genes, the current standard GWAS model still has problems that need to be solved. Among them, the population structure is one of the most severe problems when detecting QTLs in GWAS since the GWAS model is statistically confounded by effects derived from the population structure. Further, the existence of QTLs, whose effects depend on the genetic background, also affects the conventional GWAS results by causing many false positives. Although the model to detect these population-specific QTLs has already been developed, this model requires prior information on the population structure, which may only sometimes be available. Also, the previous model only assumed the situation where QTLs interact with the discrete population structure. However, target populations of GWAS often consist of genetic resources with a more continuous population structure, and there has been no model that can consider such QTLs interacting with the continuous structure. In this study, by explicitly including an interaction term between a SNP/haplotype block and the genetic background in the conventional SNP-based/haplotype block-based GWAS model, we developed two models, named SNPxGB and HBxGB, that can detect QTLs interacting with the discrete and continuous structure. Our developed models were compared to the previous models by a simulation study assuming some types of QTLs, i.e., QTLs with effects common to all the backgrounds, specific to one genetic background, and interacting with polygenes. The simulation study showed that the models assuming the same situation as the simulation settings for each QTL type were suitable for detecting the corresponding QTLs. Primarily, our second HBxGB model could detect QTLs interacting with polygenes, i.e., continuous population structure, better than the previous model utilizing the prior population structure information. Our developed models are expected to help unravel the unknown genetic architecture of many complex traits. Author summaryGWAS aims at detecting candidate genes associated with a target trait via statistical testing. Since a classical GWAS starts with the constitution of a panel of individuals, usually gathered from different populations, many methods have been proposed to control the false positives in large datasets with a strong population structure. However, most methods assume the same QTL effect across populations, which is not always true in the natural biological process. One study has proposed a method to consider population-specific QTL effects by assuming marker effects depend on each subpopulation with prior information on population membership for each individual. This information on the population structure, however, may only sometimes be available, and sometimes the population structure is more continuous rather than discrete, where their methodology cannot be applied. We successfully developed two novel models that do not require prior knowledge of the population structure by explicitly including an interaction term between a SNP/haplotype block of interest and the genetic background in the conventional SNP-based/haplotype block-based GWAS model. The developed models, named SNPxGB and HBxGB, were suitable for capturing gene effects interacting with the discrete and continuous population structure, leading to the clarification of the genetic architecture of complex traits.
Auteurs: Tristan Mary-Huard, K. Hamazaki, H. Iwata
Dernière mise à jour: 2024-03-15 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.03.13.584913
Source PDF: https://www.biorxiv.org/content/10.1101/2024.03.13.584913.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.