Modellare la diffusione di SARS-CoV-2 usando i valori Ct
I ricercatori analizzano i dati dei test per prevedere i tassi di infezione da COVID-19 nella Columbia Britannica.
― 7 leggere min
Indice
SARS-CoV-2 è il virus che causa il COVID-19. Gli scienziati possono misurare quanta quantità di virus è presente in una persona guardando qualcosa chiamato valore di Soglia di Ciclo ([CT](/it/keywords/soglia-di-ciclo--k3w4g6d)) da un test chiamato PCR. Un valore Ct più basso significa che c'è più virus nel campione. Anche se queste informazioni possono essere raccolte durante i test di routine, spesso vengono riportate semplicemente come positive o negative. Questo perché ci sono molti fattori che possono influenzare i risultati, come le differenze nei metodi di test, la qualità dei campioni e le normative che limitano come possono essere utilizzati i risultati.
Attualmente, non si raccomanda comunemente di usare i valori Ct per guidare la cura dei singoli pazienti. Tuttavia, guardare a questi valori in un gruppo di persone può aiutare i funzionari della salute pubblica a capire come il virus si sta diffondendo nella comunità. Essere in grado di prevedere con precisione come sta progredendo un'epidemia è importante per pianificare le risposte della salute pubblica, incluso dove allocare le risorse sanitarie.
Quando un focolaio sta crescendo, di solito significa che il virus è presente in grandi quantità nella comunità. Al contrario, quando l'epidemia sta diminuendo, spesso c'è meno virus in giro. I ricercatori hanno già mostrato che usare i valori Ct aggregati può aiutare a modellare la traiettoria di un focolaio. Tuttavia, man mano che le strategie di test si sono concentrate sulle persone sintomatiche, è diventato più difficile fare affidamento sui valori Ct per descrivere cosa stava succedendo nella popolazione più ampia.
In alcune zone, come la Columbia Britannica, in Canada, le pratiche di test sono cambiate significativamente durante la pandemia. A partire da dicembre 2021, i test PCR sono stati limitati mentre venivano introdotti test antigenici rapidi, rendendo difficile capire come si comportava il virus nella comunità. Sono necessari nuovi metodi per stimare quante persone si stanno infettando che non si basino su pratiche di test biased. Questo include l'uso di modelli che tengono conto di diverse strategie di test e fattori che influenzano il Carico Virale, come la variante del virus e lo stato di Vaccinazione.
Varianti e Vaccinazione
Diverse varianti di SARS-CoV-2 possono avere impatti variabili sul carico virale. Ad esempio, la variante Delta e alcune sottovarianti di Omicron sono state collegate a livelli più elevati del virus in individui infetti. Anche la vaccinazione gioca un ruolo; le evidenze suggeriscono che gli individui vaccinati che si infettano hanno carichi virali più bassi, il che potrebbe significare che sono meno propensi a trasmettere il virus ad altri.
Scopo dello Studio
Questo studio ha esaminato due metodi di modellazione per prevedere quante persone erano infettate da SARS-CoV-2 basandosi sui valori Ct. I ricercatori si sono concentrati su dati della Columbia Britannica, analizzando sia modelli di Apprendimento Automatico che modelli epidemici tradizionali. Hanno testato cinque diversi metodi di apprendimento automatico e li hanno convalidati rispetto a due modelli epidemici consolidati per vedere quali performassero meglio nella previsione dei numeri di casi di COVID-19.
Disegno dello Studio
Lo studio ha incluso individui che avevano la loro infezione da SARS-CoV-2 confermata tramite test PCR dal 19 novembre 2021 all'8 gennaio 2022. Questo periodo ha catturato l'aumento della variante Omicron nella Columbia Britannica. I valori Ct sono stati analizzati in base a due diversi tipi di campioni: tamponi nasofaringei e gargarismi salini. Tuttavia, l'analisi si è concentrata sui tamponi nasofaringei perché forniscono risultati più affidabili.
Durante questo periodo, ci sono stati cambiamenti nelle pratiche di test, passando da test generali a solo individui con sintomi. Di conseguenza, raccogliere dati su individui asintomatici è diventato essenziale per rappresentare accuratamente lo stato del virus nella comunità.
Come sono Cambiate le Pratiche di Test
Il test diagnostico nella Columbia Britannica è evoluto significativamente durante la pandemia. Inizialmente, i test venivano condotti in base all'esposizione, ma col tempo si sono concentrati sugli individui sintomatici. Questo cambiamento ha limitato la capacità di catturare dati da individui asintomatici, rendendo più difficile valutare il vero numero di casi nella comunità man mano che la pandemia avanzava.
A dicembre 2021, l'introduzione di test antigenici rapidi significava che i test PCR potevano essere effettuati solo in situazioni ad alto rischio. Lo studio si è concentrato su individui asintomatici testati per lavoro o viaggio per avere una comprensione più ampia dei tassi di infezione.
Dati di Laboratorio
Lo studio ha utilizzato dati da laboratori della Columbia Britannica che hanno condotto test per SARS-CoV-2. Hanno incluso solo test basati sul gene dell'Envelope (E), assicurando coerenza nei risultati. Se una persona veniva testata più volte in una settimana, solo il primo risultato positivo veniva incluso per evitare casi duplicati.
Stato di Vaccinazione
Lo stato di vaccinazione è stato categorizzato in base a quando gli individui ricevevano le dosi del vaccino. Gli individui completamente vaccinati dovevano aspettare almeno 14 giorni dopo l'ultima dose per essere conteggiati come vaccinati. Gli altri venivano classificati come non vaccinati o parzialmente vaccinati a seconda della loro storia vaccinale.
Caso Studio di Focolaio
Oltre all'analisi più ampia, i ricercatori hanno esaminato un focolaio specifico in una struttura di assistenza a lungo termine nella Columbia Britannica. Hanno scelto questo particolare focolaio perché forniva una visione dettagliata di come il virus si diffondeva all'interno di una comunità chiusa. L'epidemia includeva test regolari dei residenti e del personale, consentendo ai ricercatori di monitorare efficacemente la trasmissione.
Fonti di Dati
Lo studio ha utilizzato due principali fonti di dati: un database di laboratorio che includeva tutti i risultati dei test diagnostici e un registro di vaccinazione che dettaglia le storie vaccinali degli individui. Collegare questi dataset ha permesso ai ricercatori di eseguire un'analisi più approfondita dei casi e delle loro connessioni allo stato di vaccinazione.
Apprendimento Automatico e Modellazione Epidemica
La ricerca ha confrontato due approcci principali: apprendimento automatico e modellazione epidemica. Per l'apprendimento automatico, sono stati testati cinque diversi metodi per prevedere quante persone erano infettate in base a dati simulati. I ricercatori hanno utilizzato il software R per generare grandi dataset basati sulla distribuzione Ct.
Il secondo approccio ha utilizzato un modello epidemico tradizionale chiamato SEIR, che suddivide la diffusione della malattia in quattro fasi: Suscettibile, Esposto, Infettato e Guarito. Questo modello aiuta a catturare come un'infezione progredisca attraverso una popolazione.
Risultati e Confronti
Durante il periodo dello studio, sono stati eseguiti oltre 331.000 test nella Columbia Britannica, con circa 79.000 risultati positivi per SARS-CoV-2. Dopo averci concentrato sul primo risultato positivo per persona, circa 71.000 casi sono stati inclusi nell'analisi. La maggior parte dei casi si è verificata in adulti di età compresa tra 18 e 59 anni, con la variante Omicron che risultava la più comune.
I modelli di apprendimento automatico hanno mostrato una maggiore precisione man mano che le dimensioni del campione aumentavano. Il modello Random Forest ha ottenuto le migliori prestazioni quando si guardava a dataset più ampi. Per il modello SEIR, ha previsto con precisione un aumento dei casi avvenuto verso la fine di dicembre 2021.
Lo studio ha anche convalidato le capacità predittive dei modelli rispetto ai dati sull'epidemia. Il modello SEIR ha corrisposto da vicino ai conteggi reali dei casi, dimostrando che potrebbe essere un approccio pratico per le indagini sugli epidemici.
Conclusione
Questo studio ha evidenziato l'importanza di utilizzare tecniche di modellazione avanzate per prevedere la diffusione del COVID-19. Analizzando i valori Ct da un gran numero di campioni, i ricercatori possono ottenere informazioni preziose su come il virus si comporta nella comunità. I metodi di apprendimento automatico e il modello SEIR hanno entrambi mostrato promesse nel fornire previsioni affidabili, che possono aiutare a informare le risposte della salute pubblica.
Stimare accuratamente l'incidenza di COVID-19 è essenziale per una pianificazione efficace e per l'allocazione delle risorse durante gli focolai. I risultati dello studio possono essere applicati a future pandemie o ad altre malattie infettive per migliorare le strategie di sorveglianza e risposta.
Utilizzando queste tecniche di modellazione, i funzionari della salute pubblica possono prendere decisioni migliori riguardo le vaccinazioni, la distribuzione delle risorse e le pratiche di isolamento. Questa ricerca pone le basi per sviluppare approcci simili per altre infezioni e sottolinea la necessità di un'analisi dei dati in tempo reale nella gestione delle crisi sanitarie.
In generale, questo lavoro fornisce importanti informazioni su come i metodi scientifici possano essere applicati per affrontare questioni urgenti di salute pubblica in modo tempestivo ed efficace.
Titolo: Prediction of SARS-CoV-2 transmission dynamics based on population-level cycle threshold values: A Machine learning and mechanistic modeling study
Estratto: BackgroundPolymerase chain reaction (PCR) cycle threshold (Ct) values can be used to estimate the viral burden of Severe Acute Respiratory Syndrome Coronavirus type 2 (SARS-CoV-2) and predict population-level epidemic trends. We investigated the use of machine learning (ML) and epidemic transmission modeling based on Ct value distribution for SARS-CoV-2 incidence prediction during an Omicron-predominant period. MethodsUsing simulated data, we developed a ML model to predict the reproductive number based on Ct value distribution, and validated it on out-of-sample province-level data. We also developed an epidemiological model and fitted it to province-level data to accurately predict incidence. ResultsBased on simulated data, the ML model predicted the reproductive number with highest performance on out-of-sample province-level data. The epidemiological model was validated on outbreak data, and fitted to province-level data, and accurately predicted incidence. Conclusions These modeling approaches can complement traditional surveillance, especially when diagnostic testing practices change over time. The models can be tailored to different epidemiological settings and used in real time to guide public health interventions. FundingThis work was supported by funding from Genome BC, Michael Smith Foundation for Health Research and British Columbia Centre for Disease Control Foundation to C.A.H. This work was also funded by the Public Health Agency of Canada COVID-19 Immunity Task Force COVID-19 Hot Spots Competition Grant (2021-HQ-000120) to M.G.R.
Autori: Catherine A Hogan, A. A. Khan, H. Sbihi, M. A. Irvine, A. N. Jassem, Y. Joffres, B. Klaver, N. Janjua, A. Bharmal, C. Ng, A. Wilmer, J. Galbraith, M. G. Romney, B. Henry, L. Hoang, M. Krajden
Ultimo aggiornamento: 2023-03-06 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2023.03.06.23286837
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.03.06.23286837.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.