Simple Science

Scienza all'avanguardia spiegata semplicemente

# Scienze della salute# Epidemiologia

Migliorare le previsioni di ospedalizzazione per l'influenza

Nuovi metodi migliorano la precisione nel prevedere i ricoveri ospedalieri legati all'influenza.

― 8 leggere min


Avanzamenti nelleAvanzamenti nelleprevisioni dell'influenzaprevisioni per i ricoveri da influenza.Nuove strategie migliorano le
Indice

L'influenza, conosciuta comunemente come flu, è un'infezione virale che colpisce il sistema respiratorio. Questa infezione è presente da secoli, ma continua a essere un problema serio per la salute pubblica in tutto il mondo. Ogni anno, il flu porta a molte Ospedalizzazioni e decessi. Negli Stati Uniti, per esempio, le ospedalizzazioni legate al flu possono variare notevolmente, raggiungendo tra 100.000 e 700.000, con decessi che vanno da 5.000 a 50.000 all'anno.

Avere previsioni accurate e tempestive sull'attività del flu può aiutare agenzie sanitarie, ospedali, aziende e il pubblico in generale a prepararsi meglio per la stagione del flu. Tuttavia, prevedere le tendenze del flu può essere difficile perché i modelli di focolai di influenza sono imprevedibili, e i dati storici sono spesso limitati.

Progressi nella Previsione dell'Influenza

Negli ultimi anni, la scienza della previsione dell'influenza ha fatto enormi passi avanti. I ricercatori ora combinano varie fonti di dati e metodi per prevedere l'attività del flu in modo più accurato a livello statale. Ci sono molte tecniche statistiche efficaci usate a questo scopo, come i modelli di regressione e i metodi autoregressivi. I ricercatori hanno anche impiegato nuove tecniche di apprendimento automatico per migliorare le previsioni.

Un contributore chiave per far avanzare questo campo è stata la sfida FluSight organizzata dai Centers for Disease Control and Prevention (CDC). Dal 2013, queste sfide hanno incoraggiato scienziati a sviluppare e testare modelli di previsione in tempo reale. Mentre le sfide precedenti si concentravano sulla previsione dell'attività generale del flu, quelle recenti si sono spostate verso la previsione delle ospedalizzazioni dovute al flu. Questo cambiamento nasce dalla consapevolezza che i tassi di ospedalizzazione sono più rilevanti per i funzionari della salute che cercano di gestire le risorse in modo efficace.

Dati Limitati e le Loro Sfide

Una grande sfida nella previsione delle ospedalizzazioni da influenza è che prima del 2020, i dati di ospedalizzazione consistenti erano disponibili solo in pochi stati. Con il recente focus sui dati di ospedalizzazione, ci sono solo due stagioni influenzali (2020-21 e 2021-22) in cui sono disponibili informazioni complete sulle ospedalizzazioni per tutti gli stati. Inoltre, la pandemia di COVID-19 ha influenzato le tendenze delle ospedalizzazioni da influenza, rendendo ancora più difficile raccogliere dati utili per le previsioni.

La mancanza di dati crea problemi per l'addestramento dei modelli di previsione, in particolare per gli approcci avanzati di apprendimento automatico che richiedono dati estesi. I modelli statistici tradizionali possono funzionare con meno dati, ma la loro precisione può diminuire quando non ci sono informazioni sufficienti per perfezionarli.

Un altro ostacolo è la necessità di produrre previsioni in tempo reale rapidamente. Durante l'inizio della stagione influenzale 2022-23, i ricercatori avevano meno di due settimane per preparare le loro previsioni, che non erano abbastanza per affrontare adeguatamente la questione della scarsità di dati. Inoltre, le incoerenze nella segnalazione dei dati e le differenze nella qualità dei dati tra le regioni complicano ulteriormente le cose per chi cerca di creare previsioni affidabili.

Un Nuovo Approccio alla Previsione

Per affrontare i problemi di dati limitati e la necessità di previsioni accurate, i ricercatori hanno sviluppato un metodo nuovo. Hanno utilizzato il transfer learning, una tecnica in cui la conoscenza acquisita in un'area viene applicata a un'altra. Facendo così, hanno creato una strategia per migliorare i dati utilizzando informazioni storiche da malattie simili all'influenza (ILI) negli Stati Uniti.

I ricercatori hanno prima costruito un modello per analizzare le ospedalizzazioni passate da influenza usando i dati ILI, il che ha contribuito a creare un dataset più ampio stimando le ospedalizzazioni basate su tendenze decennali dai dati ILI disponibili. Questo dataset arricchito ha reso possibile utilizzare i dati di tutti gli stati, tranne Florida e Porto Rico, per prevedere le ospedalizzazioni nonostante la scarsità di dati diretti sulle ospedalizzazioni. Questo approccio di transfer learning ha permesso di addestrare e perfezionare modelli avanzati di apprendimento automatico che possono prevedere le ospedalizzazioni da influenza con precisione.

Metodi Utilizzati nella Previsione

Raccolta Dati

I dati per le ospedalizzazioni da influenza provenivano da varie fonti. Il CDC mantiene un database che tiene traccia del numero di ospedalizzazioni legate all'influenza. Queste informazioni sono cruciali per creare previsioni accurate. Un'altra fonte di dati chiave era la Rete di Sorveglianza per Malattie Simili all'Influenza nelle Cure Ambulatoriali, che raccoglie informazioni dai fornitori di assistenza sanitaria riguardo a pazienti con sintomi simili all'influenza.

Aumento dei Dati

Per affrontare le limitazioni dei dati, i ricercatori hanno sviluppato un metodo per estendere i dati di ospedalizzazione disponibili usando informazioni ILI. Hanno creato un modello per mappare i dati storici ILI alle ospedalizzazioni. Questo processo ha coinvolto la standardizzazione dei dati per garantire coerenza e affidabilità. I ricercatori hanno scoperto che analizzare dati combinati da stati con dati di ospedalizzazione completi produceva risultati migliori rispetto a cercare di analizzare ogni stato separatamente.

Dopo aver sviluppato il modello, hanno creato una serie temporale estesa di dati sulle ospedalizzazioni, che è stata poi fusa con dati reali di ospedalizzazione per formare un dataset continuo che inizia nel 2012. Questo passaggio è stato cruciale per generare un dataset completo utile per l'addestramento dei modelli di previsione.

Modelli di Previsione

Per creare previsioni robuste, i ricercatori hanno impiegato vari modelli per prevedere le ospedalizzazioni da influenza. Questi includevano metodi statistici standard come ARIMA e regressione autoregressiva regolarizzata (VAR), insieme a modelli di apprendimento automatico come LightGBM. Durante il processo di previsione, hanno adattato i modelli in base alle prestazioni recenti e hanno continuamente perfezionato le loro previsioni.

Per le stagioni 2022-23 e 2023-24, i ricercatori hanno usato diverse combinazioni di questi modelli. Hanno sviluppato metodi per creare previsioni fino a quattro settimane in avanti nella stagione 2022-23 e fino a cinque settimane nella stagione successiva. Questa flessibilità ha permesso aggiornamenti tempestivi delle previsioni man mano che nuovi dati diventavano disponibili.

Validazione e Prestazioni del Modello

I ricercatori hanno testato rigorosamente i loro modelli di previsione per garantire l'accuratezza. I loro modelli hanno partecipato alla sfida FluSight del CDC, dove si sono classificati quarti nella prima stagione e secondi nella successiva. Questa validazione ha dimostrato quanto fosse efficace il loro approccio nella creazione di previsioni affidabili.

Hanno confrontato le prestazioni dei loro modelli di dati aumentati con quelli che utilizzavano dati originali, scoprendo che i modelli addestrati con dataset estesi avevano performance significativamente migliori. La combinazione di aumento dei dati e metodi di modellazione avanzati si è rivelata cruciale per ottenere previsioni più accurate sulle ospedalizzazioni.

Valutazione dell'Accuratezza del Modello

Per valutare l'efficacia dei loro modelli di previsione, i ricercatori hanno calcolato gli errori di previsione e confrontato le loro previsioni con dati reali di ospedalizzazione. I loro risultati hanno indicato che i loro modelli aumentati potevano catturare efficacemente il tempismo delle stagioni influenzali e le tendenze, anche se c'erano ancora discrepanze nell'accuratezza nella previsione dei valori di picco di ospedalizzazione.

Per esempio, mentre le loro previsioni si allineavano strettamente con i dati reali durante i periodi influenzali normali, ci sono stati momenti in cui hanno sottovalutato i picchi. Questo ha evidenziato la necessità di un miglioramento continuo nelle loro tecniche di aumento dei dati per perfezionare ulteriormente i modelli.

Risultati Chiave e Sfide

La ricerca ha fornito intuizioni preziose. In primo luogo, avere una migliore qualità e disponibilità dei dati ha giocato un ruolo significativo nel migliorare le prestazioni dei modelli. L'approccio di aumento dei dati ha permesso ai ricercatori di utilizzare informazioni storiche per creare un dataset più ricco per l'addestramento dei modelli, cosa essenziale per previsioni accurate.

Tuttavia, rimanevano delle sfide. I ricercatori hanno riconosciuto che il loro metodo per stimare i picchi dei volumi di ospedalizzazione necessitava di miglioramenti. C'era una tendenza sistematica a sottovalutare questi valori di picco, il che ha indicato la necessità di affinare i loro metodi di raccolta dati e integrare ulteriori fonti di dati.

Direzioni Future nella Previsione dell'Influenza

Guardando al futuro, i ricercatori hanno evidenziato diverse aree per future esplorazioni. C'è potenziale per migliorare i metodi di aumento dei dati, incorporando diversi tipi di dati per migliorare l'accuratezza nella stima delle curve di ospedalizzazione. Fonti di dati in tempo reale, come tendenze sui social media e query di ricerca, potrebbero anche migliorare le capacità predittive per le ospedalizzazioni.

Inoltre, mentre i loro metodi si sono rivelati efficaci per prevedere il flu, sarebbe importante valutare se questi approcci potessero applicarsi ad altre malattie infettive. Inoltre, sviluppare modelli che incorporino più flussi di dati e diversi orizzonti temporali potrebbe rafforzare la resilienza degli sforzi di previsione in scenari dove i dati sono scarsi.

Infine, con i recenti progressi nelle tecniche di apprendimento automatico, c'è l'opportunità di perfezionare modelli specificamente progettati per i virus respiratori. Questo potrebbe migliorare significativamente le capacità predittive per le tendenze sanitarie di base.

Conclusione

Prevedere accuratamente le ospedalizzazioni da influenza è essenziale per la preparazione e l'allocazione delle risorse nella salute pubblica. L'integrazione di tecniche di modellazione avanzate, metodi statistici e strategie di aumento dei dati dimostra un potenziale promettente per migliorare gli sforzi di previsione del flu. Sebbene l'approccio si sia mostrato efficace, una ricerca continua è cruciale per migliorare ulteriormente i metodi e affrontare le lacune esistenti nell'accuratezza delle previsioni. Continuando a sviluppare queste tecniche, i ricercatori possono contribuire a migliorare le risposte della salute pubblica agli focolai di influenza e potenzialmente ad altre malattie infettive.

Fonte originale

Titolo: A prospective real-time transfer learning approach to estimate Influenza hospitalizations with limited data.

Estratto: Accurate, real-time forecasts of influenza hospitalizations would facilitate prospective resource allocation and public health preparedness. State-of-the-art machine learning methods are a promising approach to produce such forecasts, but they require extensive historical data to be properly trained. Unfortunately, historically observed data of influenza hospitalizations, for the 50 states in the United States, are only available since the beginning of 2020, as their collection was motivated and enabled by the COVID-19 pandemic. In addition, the data are far from perfect as they were under-reported for several months before health systems began consistently and reliably submitting their data. To address these issues, we propose a transfer learning approach to perform data augmentation. We extend the currently available two-season dataset for state-level influenza hospitalizations in the US by an additional ten seasons. Our method leverages influenza-like illness (ILI) surveillance data to infer historical estimates of influenza hospitalizations. This cross-domain data augmentation enables the implementation of advanced machine learning techniques, multi-horizon training, and an ensemble of models for forecasting using the ILI training data set, improving hospitalization forecasts. We evaluated the performance of our machine learning approaches by prospectively producing forecasts for future weeks and submitting them in real time to the Centers for Disease Control and Prevention FluSight challenges during two seasons: 2022-2023 and 2023-2024. Our methodology demonstrated good accuracy and reliability, achieving a fourth place finish (among 20 participating teams) in the 2022-23 and a second place finish (among 20 participating teams) in the 2023-24 CDC FluSight challenges. Our findings highlight the utility of data augmentation and knowledge transfer in the application of machine learning models to public health surveillance where only limited historical data is available. Author summaryInfluenza is a major public health concern in the United States, causing thousands of hospitalizations annually. Accurate and timely forecasts of hospitalization rates are essential for effective public health preparedness. However, limited historical data makes forecasting with state-of-the-art models challenging. To address this issue, we developed a cross-domain data augmentation method that allowed us to train advanced machine learning models using symptom-based (syndromic) surveillance data. We then created a set of models, focusing on gradient-boosted machines, and combined them into an ensemble framework. This approach successfully overcame data limitations, outperforming the majority of teams participating in the CDC FluSight project for 2022-23 and 2023-24. Additionally, our forecasts demonstrated superior accuracy to the CDCs composite model in the 2022-23 season and matched its performance in 2023-24. Our study demonstrates a robust and data-efficient strategy for training machine learning models for use in public health forecasting.

Autori: Austin G Meyer, F. Lu, L. Clemente, M. Santillana

Ultimo aggiornamento: 2024-07-18 00:00:00

Lingua: English

URL di origine: https://www.medrxiv.org/content/10.1101/2024.07.17.24310565

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.07.17.24310565.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili