Simple Science

La science de pointe expliquée simplement

# Biologie# Biologie de l'évolution

Les taux de recombinaison affectent l'histoire des populations

Des taux de recombinaison élevés remettent en question notre compréhension de la génétique des populations.

― 9 min lire


Les taux de recombinaisonLes taux de recombinaisoninfluencent les infosgénétiques.recherche génétique.inférences démographiques dans laUne forte recombinaison complique les
Table des matières

L'étude des variations génétiques dans les populations en dit beaucoup sur leur histoire et leur évolution. Les scientifiques ont pu apprendre comment différentes espèces ont évolué au fil du temps en examinant leurs données génétiques. Avec de plus en plus de données génomiques disponibles, les chercheurs ont développé plusieurs méthodes pour analyser ces données afin de comprendre les mouvements, les changements et la dynamique des populations.

Ces méthodes sont souvent d'abord utilisées sur les humains pour cerner notre propre histoire démographique. Une fois validées, elles sont appliquées aux animaux et aux plantes, ce qui nous aide à en apprendre plus sur leur évolution et aide aux efforts de conservation. Cependant, l'efficacité de ces méthodes sur des espèces non humaines n'a pas été testée en profondeur.

Graphique d'Hybridation Ancestrale

Une approche populaire pour suivre l'histoire des populations est le graphique d'hybridation ancestrale (ARG). Ce graphique illustre l'histoire du matériel génétique transmis au fil des générations. Il montre comment différentes séquences d'ADN sont liées et peut fournir des informations sur des événements comme les Mutations, qui sont des changements dans la séquence d'ADN.

L'ARG capture beaucoup d'infos sur l'histoire d'une population. En étudiant ces graphiques, les scientifiques peuvent avoir un aperçu des événements qui ont façonné la structure génétique d'une population au fil du temps. Cependant, pour que cette méthode fonctionne, les chercheurs doivent inférer avec précision l'ARG à partir des données génétiques. Cette inférence repose sur la présence de mutations, qui indiquent où des changements se sont produits dans les séquences d'ADN. La fréquence des mutations par rapport à celle de l'hybridation peut grandement influencer la capacité des scientifiques à reconstruire l'ARG.

Taux de Recombinaison et Mutations

La recombinaison est un processus naturel où le matériel génétique est mélangé pendant la reproduction. Si la recombinaison se produit souvent comparée aux mutations, cela peut compliquer la capacité à identifier certaines branches de l'ARG avec précision.

Chez les humains et certaines autres espèces, les taux de recombinaison sont généralement bas, permettant des aperçus plus clairs de leur histoire génétique. Cependant, ce n'est pas le cas pour toutes les espèces, notamment celles sans certains facteurs génétiques qui influencent la recombinaison. Pour les espèces avec des taux de recombinaison élevés, l'ARG peut ne pas refléter correctement l'histoire car beaucoup de branches pourraient manquer.

Enquête sur l'Impact de la Recombinaison

Dans cette étude, les chercheurs ont voulu comprendre comment des taux de recombinaison différents affectent la précision des inférences démographiques basées sur les méthodes ARG. Ils ont mené des simulations pour imiter différentes histoires de populations et des modèles de recombinaison, testant ces méthodes dans divers scénarios.

Les chercheurs se sont concentrés sur deux méthodes, MSMC2 et Relate, qui diffèrent dans leur façon de modéliser l'ARG. MSMC2 se penche sur les temps de coalescence, qui sont des points dans le passé où deux séquences partagent un ancêtre commun. En revanche, Relate infère une série de généalogies à travers le génome.

Pour évaluer l'impact des taux de recombinaison élevés, ils ont simulé des génomes avec divers paysages de recombinaison et ont suivi combien ces méthodes pouvaient inférer la taille des populations historiques et les événements de séparation dans différentes conditions.

Conception de l'Étude de Simulation

Les simulations impliquaient trois populations qui se sont séparées d'un ancêtre commun à un moment choisi de l'histoire. Chaque population a suivi une trajectoire différente concernant sa taille : l'une est restée constante, une autre a augmenté et la dernière a diminué au fil du temps. Pour examiner l'impact des taux de recombinaison, les chercheurs ont créé plusieurs cartes génétiques, modifiant le taux de recombinaison à travers différentes régions du chromosome.

L'étude a particulièrement porté sur la question de savoir si masquer les régions à haute recombinaison améliorerait la précision des inférences démographiques. Ce masquage impliquait de cacher certaines portions du génome identifiées comme à haute recombinaison. En comparant les résultats avec et sans ces régions masquées, les chercheurs espéraient mettre en évidence les effets de la recombinaison sur l'inférence.

Résultats sur les Inférences de Taille de Population

Les résultats initiaux ont montré que lorsque les régions à haute recombinaison n'étaient pas masquées, la méthode MSMC2 produisait des estimations très bruyantes, surtout pour les histoires récentes. Même lorsque les taux de recombinaison étaient plus bas que les taux de mutations, il était difficile d'obtenir des estimations précises pour le passé récent. À mesure que le taux moyen de recombinaison augmentait par rapport aux taux de mutations, les tailles de population inférées commençaient à dévier de manière significative des valeurs attendues.

En revanche, la méthode Relate, qui utilisait plus de points de données à travers les haplotypes, s'en sortait mieux même lorsque les régions à haute recombinaison étaient incluses. Bien qu'elle montrât encore un certain niveau de sous-estimation pour certaines tailles de population, elle était globalement moins affectée comparée à MSMC2.

Les résultats indiquaient que lorsque les régions à haute recombinaison étaient retirées de la considération, tant MSMC2 que Relate produisaient des inférences démographiques plus précises. Les conclusions suggéraient que les erreurs localisées au sein des zones à haute recombinaison avaient un impact significatif sur les inférences faites par ces méthodes.

Inférences sur les Événements de Séparation de Population

L'étude a également examiné comment la recombinaison influençait l'inférence des séparations historiques de populations. Le taux de coalescence croisée relatif (rCCR) a été utilisé pour mesurer le timing et l'occurrence des événements de séparation entre les populations. Pour MSMC2 et Relate, la présence de régions à haute recombinaison déformait le moment des séparations inférées.

Particulièrement, MSMC2 indiquait des séparations de population se produisant plus tôt que les événements réels, surtout lors de la gestion de populations ayant subi des changements de taille significatifs. En revanche, Relate produisait des estimations qui correspondaient étroitement aux vrais temps de séparation quand les régions à haute recombinaison étaient masquées.

Ces résultats ont renforcé l'idée que les régions à haute recombinaison peuvent entraîner des biais dans les arguments sur l'histoire des populations, affectant la précision avec laquelle les chercheurs peuvent retracer les séparations de population.

Évaluation des Effets des Régions à Haute Recombinaison Étroites

Pour approfondir les taux de recombinaison variés, les chercheurs ont testé des scénarios supplémentaires impliquant des régions à haute recombinaison étroites par rapport à des régions larges. Grâce à ces simulations, ils ont constaté que bien que MSMC2 et Relate montraient une sensibilité aux taux de recombinaison élevés, ils réagissaient différemment selon la configuration du paysage de recombinaison.

Pour les scénarios avec des régions à haute recombinaison étroites, MSMC2 avait plus de difficulté que Relate, qui maintenait sa performance malgré des conditions difficiles. Cette distinction est devenue cruciale pour comprendre la robustesse des différentes méthodes face à des paysages de recombinaison élevés.

Application aux Données Réelles

Pour relier leurs découvertes à des implications concrètes, les chercheurs ont appliqué leurs méthodes à des données réelles collectées auprès du fauvette des jardins eurasiens, une espèce de chanteur. La fauvette est intéressante à étudier car, contrairement aux humains, elle n'a pas certains facteurs génétiques qui dictent le paysage de recombinaison, ce qui entraîne des régions plus larges de haute recombinaison.

En analysant les génomes de nombreux individus de fauvette, les chercheurs ont séparé les données génomiques en régions à faible et à haute recombinaison et ont effectué des inférences démographiques. Les résultats de MSMC2 reflétaient les motifs observés dans leurs simulations, montrant des différences significatives dans la taille estimée de la population et le timing des séparations en fonction du paysage de recombinaison.

Inversement, Relate a démontré une robustesse, produisant des inférences cohérentes indépendamment des taux de recombinaison présents dans les données. Cette disparité dans les performances a reflété les résultats de simulation, indiquant des applications concrètes claires de leurs découvertes.

Importance de la Prudence Avec les Méthodes Basées sur l'ARG

L'étude souligne la nécessité de faire preuve de prudence lors de l'application des méthodes basées sur l'ARG à des espèces avec des patterns de recombinaison distincts de ceux des humains. Comme beaucoup d'espèces présentent des paysages de recombinaison plus larges, les chercheurs doivent être conscients de la façon dont des taux de recombinaison élevés peuvent fausser les inférences démographiques.

Les défis pour définir quelles régions masquer en raison de la variabilité des taux de recombinaison à travers différentes espèces et chromosomes posent également des obstacles pratiques. Bien que le masquage puisse améliorer la précision, déterminer quelles régions inclure ou exclure n'est pas évident.

Conclusion

En résumé, cette étude illustre que le paysage de recombinaison peut influencer de manière significative notre compréhension de la génomique des populations. En montrant comment des taux de recombinaison élevés impactent l'inférence de l'histoire démographique et des séparations de populations, les résultats mettent en évidence des considérations essentielles pour les chercheurs travaillant avec des espèces non humaines. Une exploration continue de ces dynamiques sera vitale pour garantir que les méthodes utilisées en génomique des populations soient appliquées avec précision et efficacité à travers diverses espèces.

Source originale

Titre: High-recombining genomic regions affect demography inference

Résumé: Inference of population history of non-model species is important in evolutionary and conser- vation biology. Multiple methods of population genomics, including those to infer population history, are based on the ancestral recombination graph (ARG). These methods use observed mutations to model local genealogies changing along chromosomes. Breakpoints at which genealogies change effectively represent the positions of historical recombination events. How- ever, inference of underlying genealogies is difficult in regions with high recombination rate relative to mutation rate. This is because genealogies cover genomic intervals that are too short to accommodate sufficiently many mutations informative of the structure of the un- derlying genealogies. Despite the prevalence of high-recombining genomic regions in some non-model organisms, such as birds, its effect on ARG-based demography inference has not been well studied. Here, we use population genomics simulations to investigate the impact of high-recombining regions on ARG-based demography inference. We demonstrate that inference of effective population size and the time of population split events is systematically affected when high-recombining regions cover wide breadths of the chromosomes. We also show that excluding high-recombining genomic regions can practically mitigate this effect. Finally, we confirm the relevance of our findings in empirical analysis by contrasting demography inferences applied for a bird species, the Eurasian blackcap (Sylvia atricapilla), using different parts of the genome with high and low recombination rates. Our results suggest that demography inference using ARG-based methods should be carried out with caution when applied in species whose reference genomes contain long stretches of high-recombining regions.

Auteurs: Jun Ishigohoka, M. Liedvogel

Dernière mise à jour: 2024-02-08 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.02.05.579015

Source PDF: https://www.biorxiv.org/content/10.1101/2024.02.05.579015.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires