Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Épidémiologie

Modélisation de la diffusion du SARS-CoV-2 en utilisant des valeurs Ct

Des chercheurs analysent les données de tests pour prédire les taux d'infection au COVID-19 en Colombie-Britannique.

― 9 min lire


Prédire la propagation dePrédire la propagation dela COVID-19 avec desmodèlesCOVID-19.efficacement les infections auUtiliser des données pour estimer
Table des matières

SARS-CoV-2, c'est le virus qui cause la COVID-19. Les scientifiques peuvent mesurer la quantité de virus présente chez une personne en regardant un truc appelé la valeur de Seuil de cycle ([CT](/fr/keywords/seuil-de-cycle--k3w4g6d)) d'un test PCR. Une valeur Ct plus basse signifie qu'il y a plus de virus dans l'échantillon. Bien que cette info puisse être recueillie lors des tests de routine, elle est souvent juste rapportée comme positive ou négative. C'est parce qu'il y a plein de facteurs qui peuvent influencer les résultats, comme les différences de méthodes de test, la qualité des échantillons, et des régulations qui limitent l'utilisation des résultats.

Pour l'instant, utiliser les valeurs Ct pour orienter les soins aux patients n'est pas souvent recommandé. Par contre, regarder ces valeurs au sein d'un groupe de personnes peut aider les responsables de la santé publique à comprendre comment le virus se propage dans la communauté. Pouvoir prédire avec précision comment une épidémie progresse est important pour planifier les réponses de santé publique, y compris sur où allouer les ressources de santé.

Quand une épidémie augmente, ça veut généralement dire qu'il y a beaucoup de virus dans la communauté. À l'inverse, quand l'épidémie diminue, il y a souvent moins de virus. Des chercheurs ont déjà montré que l'utilisation de valeurs Ct agrégées peut aider à modéliser la trajectoire d'une épidémie. Cependant, avec le changement de stratégies de test qui s'orientaient vers les individus symptomatiques, c'est devenu plus dur de se fier aux valeurs Ct pour décrire ce qui se passe dans la population en général.

Dans certains endroits, comme la Colombie-Britannique, au Canada, les pratiques de test ont changé de manière significative pendant la pandémie. À partir de décembre 2021, les tests PCR ont été limités avec l'introduction des tests antigéniques rapides, ce qui rendait difficile de comprendre comment le virus se comportait dans la communauté. De nouvelles méthodes sont nécessaires pour estimer combien de personnes sont infectées sans se baser sur des pratiques de test biaisées. Ça inclut l'utilisation de modèles qui prennent en compte différentes stratégies de test et des facteurs influençant la Charge Virale, comme le variant du virus et le statut vaccinal.

Variants et Vaccination

Différents variants de SARS-CoV-2 peuvent avoir des impacts variés sur la charge virale. Par exemple, le variant Delta et certains sous-variants d'Omicron ont été liés à des niveaux plus élevés de virus chez les individus infectés. La vaccination joue aussi un rôle ; des preuves suggèrent que les personnes vaccinées qui sont infectées ont des charges virales plus basses, ce qui pourrait signifier qu'elles sont moins susceptibles de transmettre le virus à d'autres.

Objectif de l'étude

Cette étude a examiné deux méthodes de modélisation pour prédire combien de personnes étaient infectées par le SARS-CoV-2 en se basant sur les valeurs Ct. Les chercheurs ont concentré leur analyse sur les données de la Colombie-Britannique, en analysant à la fois des modèles d'Apprentissage automatique et des modèles épidémiques traditionnels. Ils ont testé cinq méthodes différentes d'apprentissage automatique et les ont validées par rapport à deux modèles épidémiques établis pour voir lesquels étaient les plus performants pour prédire les chiffres de cas de COVID-19.

Conception de l'étude

L'étude a inclus des individus dont l'infection par le SARS-CoV-2 a été confirmée par un test PCR entre le 19 novembre 2021 et le 8 janvier 2022. Cette période a capturé la montée du variant Omicron en Colombie-Britannique. Les valeurs Ct ont été analysées sur deux types d'échantillons différents : des écouvillons nasopharyngés et des gargarismes à base de sel. Cependant, l'analyse s'est concentrée sur les écouvillons nasopharyngés car ils donnent des résultats plus fiables.

Pendant cette période, les pratiques de test ont changé, passant de tests généraux à uniquement des individus présentant des symptômes. Par conséquent, la collecte de données sur les individus asymptomatiques est devenue essentielle pour représenter avec précision l'état du virus dans la communauté.

Comment les pratiques de test ont changé

Les tests diagnostiques en Colombie-Britannique ont évolué de manière significative pendant la pandémie. Au début, le test se faisait en fonction de l'exposition, mais ça a évolué pour cibler les individus symptomatiques au fil du temps. Ce changement a limité la capacité à recueillir des données provenant d'individus asymptomatiques, rendant plus difficile l'évaluation du vrai nombre de cas dans la communauté au fur et à mesure de la progression de la pandémie.

En décembre 2021, l'introduction des tests antigéniques rapides a signifié que les tests PCR ne pouvaient être réalisés que dans des situations à haut risque. L'étude a donc ciblé des individus asymptomatiques testés pour le travail ou le voyage afin d'obtenir une compréhension plus large des taux d'infection.

Données de laboratoire

L'étude a utilisé des données provenant de laboratoires à travers la Colombie-Britannique qui ont réalisé des tests SARS-CoV-2. Ils n'ont inclus que les tests basés sur le gène Enveloppe (E), garantissant la cohérence des résultats. Si une personne a été testée plusieurs fois au cours d'une semaine, seul son premier résultat positif a été inclus pour éviter les doublons.

Statut vaccinal

Le statut vaccinal a été catégorisé en fonction de quand les individus ont reçu leurs doses de vaccin. Les personnes entièrement vaccinées devaient attendre au moins 14 jours après leur dernière dose pour être comptées comme vaccinées. Les autres étaient classées soit comme non vaccinées, soit comme partiellement vaccinées en fonction de leur historique de vaccination.

Étude de cas d'épidémie

En plus de l'analyse plus large, les chercheurs ont examiné une épidémie spécifique dans un établissement de soins de longue durée en Colombie-Britannique. Ils ont choisi cette épidémie particulière car elle offrait une vue détaillée de comment le virus se propageait dans une communauté fermée. L'épidémie incluait des tests réguliers des résidents et du personnel, permettant aux chercheurs de suivre la transmission efficacement.

Sources de données

L'étude a utilisé deux sources de données principales : une base de données de laboratoire incluant tous les résultats de tests diagnostics et un registre de vaccination détaillant les historiques de vaccination des individus. Lier ces ensembles de données a permis aux chercheurs de réaliser une analyse plus approfondie des cas et de leurs liens avec le statut vaccinal.

Apprentissage automatique et modélisation épidémique

La recherche a comparé deux approches principales : l'apprentissage automatique et la modélisation épidémique. Pour l'apprentissage automatique, cinq méthodes différentes ont été testées pour prédire combien de personnes étaient infectées à partir de données simulées. Les chercheurs ont utilisé le logiciel R pour générer de grands ensembles de données basés sur la distribution des Ct.

La deuxième approche a utilisé un modèle épidémique traditionnel appelé SEIR, qui décompose la propagation de la maladie en quatre étapes : Susceptible, Exposé, Infecté et Rétabli. Ce modèle aide à capturer comment une infection progresse à travers une population.

Résultats et Comparaisons

Pendant la période de l'étude, plus de 331 000 tests ont été réalisés en Colombie-Britannique, avec environ 79 000 tests positifs pour SARS-CoV-2. Après s'être concentré sur le premier résultat positif par personne, environ 71 000 cas ont été inclus dans l'analyse. La plupart des cas étaient chez des adultes âgés de 18 à 59 ans, avec le variant Omicron étant le plus courant.

Les modèles d'apprentissage automatique ont montré une meilleure précision à mesure que les tailles d'échantillons augmentaient. Le modèle Random Forest a été le plus performant en regardant des ensembles de données plus grands. Pour le modèle SEIR, il a prédit de manière précise une augmentation des cas qui a eu lieu vers fin décembre 2021.

L'étude a également validé les capacités prédictives des modèles par rapport aux données de l'épidémie. Le modèle SEIR s'est rapproché des chiffres réels, montrant qu'il pourrait être une approche pratique pour les investigations épidémiques.

Conclusion

Cette étude a mis en avant l'importance d'utiliser des techniques de modélisation avancées pour prédire la propagation de la COVID-19. En analysant les valeurs Ct d'un grand nombre d'échantillons, les chercheurs peuvent obtenir des informations précieuses sur comment le virus se comporte dans la communauté. Les méthodes d'apprentissage automatique et le modèle SEIR ont tous deux montré un potentiel pour fournir des prédictions fiables, ce qui peut aider à informer les réponses de santé publique.

Estimer avec précision l'incidence de la COVID-19 est essentiel pour une planification efficace et l'allocation des ressources durant les épidémies. Les résultats de l'étude peuvent être appliqués à de futures pandémies ou d'autres maladies infectieuses pour améliorer la surveillance et les stratégies de réponse.

En utilisant ces techniques de modélisation, les responsables de la santé publique peuvent prendre de meilleures décisions sur les Vaccinations, la distribution des ressources et les pratiques d'isolement. Cette recherche pose les bases pour développer des approches similaires pour d'autres infections et souligne la nécessité d'une analyse de données en temps réel dans la gestion des crises sanitaires.

Dans l'ensemble, ce travail fournit des perspectives importantes sur la façon dont les méthodes scientifiques peuvent être appliquées pour s'attaquer à des problèmes de santé publique pressants de manière rapide et efficace.

Source originale

Titre: Prediction of SARS-CoV-2 transmission dynamics based on population-level cycle threshold values: A Machine learning and mechanistic modeling study

Résumé: BackgroundPolymerase chain reaction (PCR) cycle threshold (Ct) values can be used to estimate the viral burden of Severe Acute Respiratory Syndrome Coronavirus type 2 (SARS-CoV-2) and predict population-level epidemic trends. We investigated the use of machine learning (ML) and epidemic transmission modeling based on Ct value distribution for SARS-CoV-2 incidence prediction during an Omicron-predominant period. MethodsUsing simulated data, we developed a ML model to predict the reproductive number based on Ct value distribution, and validated it on out-of-sample province-level data. We also developed an epidemiological model and fitted it to province-level data to accurately predict incidence. ResultsBased on simulated data, the ML model predicted the reproductive number with highest performance on out-of-sample province-level data. The epidemiological model was validated on outbreak data, and fitted to province-level data, and accurately predicted incidence. Conclusions These modeling approaches can complement traditional surveillance, especially when diagnostic testing practices change over time. The models can be tailored to different epidemiological settings and used in real time to guide public health interventions. FundingThis work was supported by funding from Genome BC, Michael Smith Foundation for Health Research and British Columbia Centre for Disease Control Foundation to C.A.H. This work was also funded by the Public Health Agency of Canada COVID-19 Immunity Task Force COVID-19 Hot Spots Competition Grant (2021-HQ-000120) to M.G.R.

Auteurs: Catherine A Hogan, A. A. Khan, H. Sbihi, M. A. Irvine, A. N. Jassem, Y. Joffres, B. Klaver, N. Janjua, A. Bharmal, C. Ng, A. Wilmer, J. Galbraith, M. G. Romney, B. Henry, L. Hoang, M. Krajden

Dernière mise à jour: 2023-03-06 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2023.03.06.23286837

Source PDF: https://www.medrxiv.org/content/10.1101/2023.03.06.23286837.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires