Simple Science

La science de pointe expliquée simplement

# Biologie# Biologie de l'évolution

Comprendre la dérive génétique dans la transmission du SARS-CoV-2

Cette étude examine comment la dérive génétique affecte la propagation du COVID-19 et l'émergence des variants.

― 9 min lire


La dérive génétique dansLa dérive génétique dansle COVID-19 expliquéeinfluence la propagation des virus.Nouvelles idées sur comment le hasard
Table des matières

La Dérive génétique aléatoire, c'est un processus qui modifie le patrimoine génétique d'une population avec le temps à cause d'événements aléatoires, surtout en ce qui concerne la naissance et la mort des individus. C'est super important dans le cadre des maladies, où la façon dont un pathogène se propage peut être pas mal influencée par cette dérive. Quand les pathogènes passent d'un hôte à un autre, de nouvelles infections (naissances) se produisent, tandis que les guérisons ou les décès des individus infectés (décès) se produisent aussi.

Les facteurs qui influent sur l'intensité de la dérive génétique chez les pathogènes incluent la fréquence de la maladie dans la population, diverses caractéristiques de la maladie, combien d'infections secondaires un individu infecté peut causer, et à quelle fréquence les hôtes se croisent. Beaucoup de maladies, y compris celles causées par le SARS, le MERS, la tuberculose et la rougeole, affichent des niveaux élevés de dérive génétique. Ça affecte la propagation de la maladie et comment de nouvelles variantes apparaissent, ainsi que l’efficacité des interventions. Donc, estimer précisément la dérive génétique est crucial pour comprendre comment les maladies évoluent et comment les contrôler.

Taille de la population effective et dérive génétique

Un indicateur clé pour évaluer la force de la dérive génétique, c'est la taille de la population effective. Ce chiffre représente un scénario idéalisé où la population se reproduit d'une manière cohérente avec les modèles observés au fil du temps. Dans une population où la dérive génétique se produit, si la taille de la population effective est plus petite que la taille réelle, ça veut dire qu'il y a des facteurs qui créent encore plus de randomité que ce qu'on attendrait juste d'un échantillonnage. Une plus petite taille de population effective indique que la dérive génétique est forte.

Des recherches récentes ont montré que la transmission du SARS-CoV-2, le virus responsable de COVID-19, présente des niveaux significatifs de randomité à cause de quelques individus qui provoquent beaucoup d'infections secondaires (appelés super propagateurs) et aussi à cause de tailles effectives de population généralement faibles.

Défis dans l'étude de la transmission du SARS-CoV-2

Bien qu'il y ait eu pas mal de focus sur des zones et des périodes spécifiques concernant la transmission du SARS-CoV-2, les études complètes qui couvrent différentes régions et moments sont limitées. Un jeu de données prometteur à ce sujet est le COVID-19 Genomics UK Consortium (COG-UK), qui a analysé près de trois millions de cas de SARS-CoV-2, surtout en Angleterre. Ce jeu de données est précieux parce qu'il a un grand nombre de cas de SARS-CoV-2 séquencés.

Cependant, étudier la dérive génétique dans ces données pose des défis, surtout en ce qui concerne le Bruit de mesure. Le bruit de mesure peut venir des variations dans les taux de test à travers les différentes périodes et lieux, ainsi que des biais dus à la traçabilité des contacts. Il existe des techniques pour estimer le bruit de mesure à partir de données de fréquence dans le temps. Dans les données de fréquence, la dérive génétique entraîne des fluctuations dans les résultats qui augmentent avec le temps, tandis que le bruit de mesure entraîne des fluctuations qui ne changent pas de taille dans le temps.

Pour analyser ces données efficacement, un modèle de Markov caché (HMM) a été proposé pour tenir compte de la dérive génétique et du bruit de mesure. Ce modèle intègre les complexités de la façon dont les infections se propagent et comment elles sont mesurées.

Développer une nouvelle méthode d'analyse

Dans cette étude, une nouvelle méthode statistique a été créée pour estimer conjointement la dérive génétique et le bruit de mesure, permettant à ce dernier de varier dans le temps. Cette approche utilise toutes les données de séquençage disponibles, ce qui est une grande amélioration par rapport aux méthodes précédentes qui s'appuyaient souvent sur l'échantillonnage d'un sous-ensemble de données. Les résultats des tests utilisant des données simulées ont montré qu'il est possible de déterminer avec précision à la fois la taille effective de la population et la force du bruit de mesure dans diverses situations.

La méthode a ensuite été appliquée aux données réelles du SARS-CoV-2 en Angleterre, se concentrant sur l'analyse des modèles de dérive génétique et de bruit de mesure à partir de plus de 490 000 génomes sequencés. Les résultats ont indiqué que la dérive génétique était systématiquement élevée tout au long de la pandémie, ce qui ne pouvait pas être entièrement expliqué par des événements de super propagation rapportés précédemment.

Comprendre les résultats

La taille effective de la population déduite des données a montré qu'elle était beaucoup plus basse que le nombre de cas positifs rapportés de SARS-CoV-2. Cela suggère qu'il y avait des niveaux significatifs de dérive génétique affectant la transmission du virus. Les découvertes ont révélé que la taille effective de la population déduite pour différentes lignées du virus variait au fil du temps mais indiquait systématiquement des valeurs plus faibles par rapport aux modèles précédents qui supposaient une population bien mélangée.

Cette divergence suggère que la dynamique de transmission du virus n'était pas uniforme dans la population, indiquant la présence de Structures communautaires influençant la façon dont le virus se propageait.

Mesurer la variabilité de la propagation du SARS-CoV-2

Les résultats de cette analyse ont également montré que les niveaux de bruit de mesure variaient entre les différentes variantes de SARS-CoV-2, même si elles étaient présentes en même temps. Par exemple, les lignées qui sont apparues avant B.1.177 avaient des niveaux de bruit de mesure différents par rapport à la lignée B.1.177 elle-même, ce qui pourrait affecter la précision de notre compréhension de la dynamique de transmission.

De plus, l'étude a comparé la taille effective de la population déduite à un modèle standard qui sert de référence pour les dynamiques de propagation du virus. Cette comparaison a systématiquement montré que la dérive génétique était beaucoup plus élevée que prévu selon les modèles traditionnels de transmission.

Facteurs contribuant à une forte dérive génétique

Deux principaux facteurs qui peuvent mener à des niveaux élevés de dérive génétique sont :

  1. Super propagation : Certains individus ont la responsabilité de transmettre le virus à beaucoup d'autres, créant une distribution plus large d'infections secondaires que d'habitude. Ce phénomène peut affecter considérablement la dynamique et la variabilité de la population.

  2. Structure de la population : La façon dont les individus interagissent au sein de leurs communautés peut créer des clusters ou "démes" où les dynamiques de transmission diffèrent. Si des individus sont très connectés au sein d'un cluster mais ont des connexions limitées avec d'autres, cela peut diminuer la taille effective de la population.

Des simulations suggèrent que même sans super propagateurs, une population structurée peut entraîner une dérive génétique significative à cause de la façon dont les infections peuvent se propager de manière écrasante au sein de certains groupes avant d'affecter d'autres.

Limitations de l'étude et directions futures

Un défi rencontré dans cette étude est que la taille effective de la population est influencée par de nombreux facteurs, rendant son interprétation complexe. Divers processus évolutifs comme la sélection, la migration et la mutation peuvent compliquer les estimations de la dérive génétique. Bien que l'étude ait examiné divers mécanismes pouvant influencer les résultats, il est clair que la recherche continue devra tenir compte de ces complexités.

Un autre défi est que les biais dans la collecte de données pourraient ne pas être entièrement pris en compte, ce qui pourrait encore affecter l'exactitude des estimations. Bien que la méthode utilisée prenne en compte certains biais d'échantillonnage qui ne sont pas liés dans le temps, les biais persistants pourraient influencer les résultats.

La fenêtre de temps utilisée pour analyser les données a lissé des changements brusques dans la taille effective de la population, indiquant un besoin de méthodes qui pourraient capturer des fluctuations plus instantanées.

Enfin, bien que cette étude se soit concentrée sur le SARS-CoV-2, les techniques développées peuvent être adaptées pour étudier la dérive génétique dans d'autres pathogènes ou espèces, élargissant ainsi les applications potentielles au-delà de la pandémie actuelle.

Conclusion

Cette étude met en lumière les complexités de la façon dont la dérive génétique influence les dynamiques de transmission des pathogènes comme le SARS-CoV-2. En développant une méthode innovante pour estimer la dérive génétique en parallèle avec le bruit de mesure, les chercheurs peuvent obtenir des insights plus profonds sur l'évolution et la transmission virale. Les résultats soulignent l'importance de prendre en compte les structures communautaires et les comportements individuels lors de la modélisation de la propagation des maladies. Alors qu'on continue à naviguer dans les réalités des maladies infectieuses, des outils qui améliorent notre compréhension seront essentiels pour des réponses et interventions de santé publique efficaces.

Source originale

Titre: Lineage frequency time series reveal elevated levels of genetic drift in SARS-CoV-2 transmission in England

Résumé: Genetic drift in infectious disease transmission results from randomness of transmission and host recovery or death. The strength of genetic drift for SARS-CoV-2 transmission is expected to be high due to high levels of superspreading, and this is expected to substantially impact disease epidemiology and evolution. However, we dont yet have an understanding of how genetic drift changes over time or across locations. Furthermore, noise that results from data collection can potentially confound estimates of genetic drift. To address this challenge, we develop and validate a method to jointly infer genetic drift and measurement noise from time-series lineage frequency data. Our method is highly scalable to increasingly large genomic datasets, which overcomes a limitation in commonly used phylogenetic methods. We apply this method to over 490,000 SARS-CoV-2 genomic sequences from England collected between March 2020 and December 2021 by the COVID-19 Genomics UK (COG-UK) consortium and separately infer the strength of genetic drift for pre-B.1.177, B.1.177, Alpha, and Delta. We find that even after correcting for measurement noise, the strength of genetic drift is consistently, throughout time, higher than that expected from the observed number of COVID-19 positive individuals in England by 1 to 3 orders of magnitude, which cannot be explained by literature values of superspreading. Our estimates of genetic drift will be informative for parameterizing evolutionary models and studying potential mechanisms for increased drift. Author SummaryThe transmission of pathogens like SARS-CoV-2 is strongly affected by chance effects in the contact process between infected and susceptible individuals, collectively referred to as random genetic drift. We have an incomplete understanding of how genetic drift changes across time and locations. To address this gap, we developed a computational method that infers the strength of genetic drift from time series genomic data that corrects for non-biological noise and is computationally scalable to the large numbers of sequences available for SARS-CoV-2, overcoming a major challenge of existing methods. Using this method, we quantified the strength of genetic drift for SARS-CoV-2 transmission in England throughout time and across locations. These estimates constrain potential mechanisms and help parameterize models of SARS-CoV-2 evolution. More generally, the computational scalability of our method will become more important as increasingly large genomic datasets become more common.

Auteurs: Oskar Hallatschek, Q. Yu, J. A. Ascensao, T. Okada, The COVID-19 Genomics UK (COG-UK) consortium, O. Boyd, E. Volz

Dernière mise à jour: 2024-01-16 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2022.11.21.517390

Source PDF: https://www.biorxiv.org/content/10.1101/2022.11.21.517390.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires