Simple Science

Scienza all'avanguardia spiegata semplicemente

# Scienze della salute# Epidemiologia

Previsione delle ondate di COVID-19 usando l'apprendimento automatico

Questo studio combina modelli tradizionali con l'apprendimento automatico per prevedere le tendenze del COVID-19.

― 8 leggere min


Machine Learning per laMachine Learning per laPredizione del COVID-19future ondate di COVID-19.Combinare modelli per prevedere le
Indice

La pandemia di COVID-19 ha portato a un forte bisogno di modelli che potessero aiutare a prevedere la diffusione del virus e a guidare le decisioni delle autorità sanitarie. Questi modelli sono strumenti matematici che ci aiutano a capire come le malattie si diffondono in base a vari fattori, come il movimento e il Comportamento delle persone. Quando è iniziata la pandemia, molti paesi hanno usato questi modelli per prepararsi a possibili ondate di infezioni.

Il Ruolo dei Modelli Matematici

I modelli matematici possono rappresentare come un virus si diffonde considerando diversi fattori. Possono basarsi su modi noti di Trasmissione delle malattie e simulare come le misure di Salute Pubblica-come lockdown e vaccinazioni-affettano il numero di infezioni. Ad esempio, quando i governi vedevano possibili picchi di casi, potevano usare i modelli per anticipare e implementare strategie per ridurre le infezioni.

Durante la pandemia, molti studi hanno dimostrato che azioni come la chiusura delle scuole e il distanziamento sociale hanno aiutato a ridurre la diffusione del COVID-19. La gente tendeva a seguire queste regole di più quando si sentiva a rischio di contagio. Tuttavia, mentre i casi diminuivano, molti diventavano meno disposti a mantenere queste misure, il che poteva portare a un'altra ondata di infezioni.

Comportamento e Diffusione della Malattia

La relazione tra comportamento umano e diffusione delle malattie è cruciale. Quando le infezioni aumentano, il comportamento delle persone cambia. Questo cambiamento può, a sua volta, influenzare la velocità con cui la malattia si diffonde. Per studiare questa interazione, alcuni modelli hanno incorporato come il comportamento delle persone influisce sulla diffusione delle malattie e viceversa.

Molti di questi modelli hanno analizzato come specifiche misure di salute pubblica potessero influenzare le azioni delle persone durante la pandemia. Ad esempio, i ricercatori hanno osservato come i test, le vaccinazioni e il distanziamento sociale abbiano influenzato il numero di persone contagiate.

L'Ascesa del Machine Learning

Con l'evolversi della pandemia, sono diventati disponibili molti dati su infezioni, movimenti e comportamento sociale. Questi dati hanno portato allo sviluppo di modelli di machine learning. Questi modelli hanno mostrato grande abilità nell'analizzare grandi quantità di informazioni sui vari fattori che influenzano la diffusione delle malattie.

I modelli di machine learning potevano adattarsi meglio a diverse aree rispetto ai modelli tradizionali. Tuttavia, avevano alcuni svantaggi significativi. Anche se potevano prevedere accuratamente le tendenze a breve termine, spesso erano difficili da capire. I risultati dei modelli di machine learning si basavano su molti parametri complessi, rendendo difficile interpretare i risultati in modo diretto.

Un Nuovo Approccio

La ricerca si è evoluta per combinare i punti di forza dei modelli matematici tradizionali con le tecniche di machine learning. Un metodo promettente ha coinvolto l'uso di machine learning informato dalla fisica (PIML). L'idea chiave dietro questo approccio era usare leggi scientifiche come guida mentre si addestravano i modelli. Questo assicura che le previsioni rimangano realistiche e coerenti con ciò che sappiamo sulla trasmissione delle malattie.

PIML può migliorare come i modelli prevedono i comportamenti epidemici, permettendo loro di mantenere l'interpretabilità mentre sfruttano il potere predittivo del machine learning. Aiuta a ridurre la dipendenza da grandi set di dati, che a volte possono essere limitati o distorti.

Equazioni Differenziali Universali

Un metodo specifico che è emerso si chiama equazioni differenziali universali (UDEs). Questo approccio coinvolge l'uso di reti neurali all'interno di modelli matematici basati su equazioni differenziali. Le UDE consentono di includere comportamenti noti di un sistema mentre lasciano il modello apprendere aspetti sconosciuti.

Ad esempio, le UDE sono state applicate efficacemente per studiare vari sistemi, inclusa la trasmissione delle malattie. I ricercatori hanno esplorato come comportamenti come la mobilità, che coinvolge i movimenti delle persone, influenzino i Tassi di infezione nel tempo.

I Nostri Obiettivi di Ricerca

L'obiettivo della nostra ricerca era combinare i bias osservazionali in un modello compartimentale con bias di apprendimento soddisfacenti per il COVID-19. Abbiamo addestrato un modello UDE per adattarsi ai dati sul comportamento e le infezioni, considerando alcune assunzioni di base su come le persone reagirebbero durante la pandemia. Volevamo vedere se questo modello potesse prevedere efficacemente future ondate di infezioni dopo aver visto solo la prima ondata e come i bias di apprendimento potessero migliorare le prestazioni del modello.

L'Importanza della Semplicità

I modelli matematici troppo complessi possono talvolta adattarsi bene ai dati esistenti ma fallire nel prevedere nuove tendenze. Al contrario, i modelli più semplici possono aiutarci a testare le nostre idee senza perderci in dettagli eccessivamente complicati. Questo è essenziale, soprattutto quando si fanno previsioni su sistemi complessi come le pandemie.

Utilizzando un framework UDE che mantenesse il nostro modello semplice, abbiamo incorporato alcune assunzioni ragionevoli sulle dinamiche comportamento-malattia. I modelli compartimentali dividono la popolazione in gruppi in base al loro stato di infezione. Questo approccio è stato una parte chiave degli studi epidemiologici per anni.

Addestramento del Modello e Bias di Apprendimento

L'algoritmo che abbiamo sviluppato ha imparato come fattori come la mobilità influenzano i tassi di infezione e come questi tassi influenzano i movimenti delle persone. I bias di apprendimento hanno guidato il modello con diverse assunzioni logiche. Ad esempio, se più persone sono contagiate, ci aspettiamo che la mobilità diminuisca.

Abbiamo eseguito il nostro modello molte volte per garantire risultati affidabili. Lo abbiamo addestrato sulla prima ondata di infezioni per vedere se potesse prevedere correttamente una potenziale seconda ondata. Il modello che includeva bias di apprendimento ha costantemente previsto le seconde ondate in modo più accurato rispetto ai modelli senza questi bias.

Previsioni del Modello

Per valutare quanto bene il modello si fosse comportato, abbiamo esaminato le previsioni medie tra le regioni. Ad esempio, a New York, il modello con bias di apprendimento ha correttamente mostrato una piccola seconda ondata, mentre il modello senza questi bias aveva meno variabilità e spesso non riusciva a prevedere affatto una seconda ondata.

Le nostre previsioni hanno evidenziato l'importanza di includere i bias di apprendimento. Il modello distorto ha previsto regolarmente seconde ondate, che erano maggiori della prima ondata nella maggior parte delle aree. Al contrario, il modello non distorto ha faticato a identificare queste tendenze.

Considerazione della Fattibilità Biologica

Entrambi i modelli che abbiamo testato hanno generalmente prodotto previsioni plausibili. Tuttavia, il modello con bias di apprendimento si è comportato meglio in molte aree, ottenendo adattamenti più affidabili ai dati e facendo meno previsioni irrealistiche. Ad esempio, ha costantemente stimato tassi di infezione che si allineavano con la nostra comprensione dei limiti biologici.

Quando abbiamo valutato quanto spesso i modelli prevedevano seconde ondate, il modello distorto identificava frequentemente queste riemergenze, mentre il modello non distorto lo faceva molto meno spesso. Questa capacità è essenziale per i funzionari sanitari che pianificano le risposte a potenziali picchi di infezioni.

Intuizioni dal Modello

Il nostro modello ha anche offerto intuizioni su come diversi fattori influenzassero i tassi di trasmissione. Analizzando la relazione tra mobilità e diffusione dell'infezione, abbiamo potuto identificare come i cambiamenti nei movimenti delle persone potrebbero influenzare futuri focolai.

In definitiva, questa comprensione è vitale. Se i funzionari possono prevedere come cambierà il comportamento delle persone man mano che le infezioni aumentano o diminuiscono, possono meglio adattare le risposte di salute pubblica.

Limitazioni del Modello

Sebbene il nostro modello semplificato di COVID-19 abbia fornito intuizioni preziose, è importante notare che non cattura ogni dettaglio della pandemia. Ad esempio, abbiamo fatto assunzioni sull'immunità e non abbiamo tenuto conto degli effetti dei vaccini, che sono diventati significativi più avanti nella pandemia.

Le previsioni a breve termine del modello possono anche essere limitate da fattori come la sottodocumentazione dei casi e le variazioni nei tassi di recupero. Lavori futuri potrebbero migliorare su questi aspetti incorporando più dettagli sul comportamento del virus e sui cambiamenti nel tempo.

Direzioni Future

Guardando avanti, ci sono molte opportunità per applicare tecniche di modellazione simili ad altre malattie infettive. Molte malattie hanno comportamenti legati ai tassi di trasmissione, rendendole adatte per questo tipo di analisi. Inoltre, ci sono altri sistemi complessi, come il cambiamento climatico, che potrebbero beneficiare di un approccio simile.

Man mano che continuano gli sforzi di raccolta dati, modelli di machine learning come le UDE possono fornire intuizioni sull'intersezione tra comportamento sociale e dinamica delle malattie. Con le giuste assunzioni e bias, questi modelli potrebbero aiutare a prevedere futuri focolai e contribuire alla progettazione di interventi efficaci.

Conclusione

La nostra ricerca dimostra che i modelli di machine learning informati socialmente e biologicamente possono prevedere efficacemente il comportamento epidemico. Incorporando bias di apprendimento nei nostri modelli, siamo stati in grado di identificare accuratamente le onde pandemiche simili a quelle osservate durante la pandemia di COVID-19. Questa capacità di prevedere le tendenze future delle infezioni è essenziale per le risposte e la presa di decisioni nella salute pubblica.

L'integrazione del machine learning con l'epidemiologia tradizionale ha un grande potenziale. Con un uso appropriato dei dati e delle assunzioni, questi modelli possono aiutare i responsabili politici a navigare le complessità delle malattie infettive e migliorare gli esiti per la salute pubblica.

Ringraziamenti

Nel creare questi modelli e condurre la nostra ricerca, abbiamo riconosciuto i valori della collaborazione, della comunicazione aperta e dell'importanza di basare il nostro lavoro su principi scientifici ben consolidati. Questo approccio continuerà a guidarci mentre esploriamo il panorama in evoluzione della modellazione e della risposta alle malattie infettive.

Fonte originale

Titolo: Predicting COVID-19 pandemic waves with biologically and behaviorally informed universal differential equations

Estratto: In the early stages of the COVID-19 pandemic, it became clear that pandemic waves and population responses were locked in a mutual feedback loop. The initial lull following strict interventions in the first wave often led to a second wave, as restrictions were relaxed. We test the ability of new hybrid machine learning techniques, namely universal differential equations (UDEs) with learning biases, to make predictions in a such a dynamic behavior-disease setting. We develop a UDE model for COVID-19 and test it both with and without learning biases describing simple assumptions about disease transmission and population response. Our results show that UDEs, particularly when supplied with learning biases, are capable of learning coupled behavior-disease dynamics and predicting second waves in a variety of populations. The model predicts a second wave of infections 55% of the time across all populations, having been trained only on the first wave. The predicted second wave is larger than the first. Without learning biases, model predictions are hampered: the unbiased model predicts a second wave only 25% of the time, typically smaller than the first. The biased model consistently predicts the expected increase in the transmission rate with rising mobility, whereas the unbiased model predicts a decrease in mobility as often as a continued increase. The biased model also achieves better accuracy on its training data thanks to fewer and less severely divergent trajectories. These results indicate that biologically informed machine learning can generate qualitatively correct mid to long-term predictions of COVID-19 pandemic waves. Significance statementUniversal differential equations are a relatively new modelling technique where neural networks use data to learn unknown components of a dynamical system. We demonstrate for the first time that this technique is able to extract valuable information from data on a coupled behaviour-disease system. Our model was able to learn the interplay between COVID-19 infections and time spent travelling to retail and recreation locations in order to predict a second wave of cases, having been trained only on the first wave. We also demonstrate that adding additional terms to the universal differential equations loss function that penalize implausible solutions improves training time and leads to improved predictions.

Autori: Chris Bauch, B. Kuwahara

Ultimo aggiornamento: 2023-03-16 00:00:00

Lingua: English

URL di origine: https://www.medrxiv.org/content/10.1101/2023.03.11.23287141

Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.03.11.23287141.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili