Prédire les admissions à l'hôpital pour COVID-19 grâce à l'analyse de données
Une étude améliore les prévisions des cas d'hôpital liés au COVID-19 en utilisant des données de mobilité et de météo.
― 9 min lire
Table des matières
La pandémie de COVID-19 a eu un impact énorme sur les hôpitaux à travers le monde depuis début 2020 jusqu'à la fin de 2021. Beaucoup de gens ont été infectés et, malheureusement, beaucoup ont perdu la vie. Fin 2022, on comptait plus de 600 millions de cas confirmés de COVID-19, avec plus de 6,6 millions de décès rapportés par les organismes de santé. Pendant cette période, les responsables de la santé locale ont eu du mal à comprendre comment la maladie se propageait dans leurs régions. Ce manque d'infos claires a compliqué la gestion des ressources hospitalières, entraînant plus de perturbations dans le système de santé que prévu.
Pour faire face à la situation, les hôpitaux devaient savoir quand reporter les traitements médicaux non urgents en fonction de l'augmentation des Cas de COVID-19. Si les cas étaient élevés, les opérations électives devaient attendre. À l'inverse, si moins de cas étaient rapportés, les hôpitaux pouvaient se concentrer sur le rattrapage des traitements reportés. La situation est devenue encore plus confuse avec l'émergence de nouveaux variants du virus, certains se propageant plus rapidement ou causant des maladies plus graves.
Dans des zones comme l'Angleterre et le Pays de Galles, il y a eu de nombreuses vagues d'infections à COVID-19 qui ont mis une pression énorme sur les ressources hospitalières. Même si les efforts de vaccination ont aidé à alléger un peu la pression, les taux d'infection et de décès sont restés élevés bien en 2022. Cela a mis en lumière le besoin urgent pour les autorités sanitaires locales d'avoir des mises à jour sur les prévisions de cas pour utiliser plus efficacement leurs ressources de santé.
Facteurs influençant la propagation du COVID-19
D'autres facteurs, en plus du virus lui-même, ont joué un rôle dans sa propagation. Des recherches ont montré que la propagation de la maladie était liée aux conditions météorologiques comme le climat et la température. Des études menées dans des pays comme la France ont révélé qu'inclure des Données Météo dans les modèles prédictifs améliorait la capacité à prévoir les Admissions à l'hôpital dues au COVID-19.
Le comportement des gens a aussi beaucoup influencé la manière dont le virus s'est propagé. Les données sur les déplacements et les interactions entre les gens ont montré des tendances qui correspondaient aux variations des taux d'infection et des décès. En regardant des facteurs comme les habitudes de déplacement et les activités sociales, les chercheurs espéraient affiner leurs prévisions sur les futures admissions à l'hôpital.
Ce travail visait à s'appuyer sur ces découvertes en utilisant à la fois des données météo et des infos sur les déplacements des gens pour créer un modèle qui pourrait prédire les admissions à l'hôpital liées au COVID-19 à un niveau plus local.
La méthode utilisée pour les prévisions
Pour faire de meilleures prévisions sur les hospitalisations liées au COVID-19, les chercheurs ont utilisé une méthode basée sur l'apprentissage machine. Dans une étude précédente, ils avaient développé avec succès un moyen de prédire les cas de maladies similaires à la grippe en utilisant des techniques similaires. Cette fois, ils ont élargi cette méthode pour intégrer les conditions météorologiques locales et les modèles de mobilité humaine afin de prévoir les admissions hebdomadaires à l'hôpital dues au COVID-19 dans sept régions d'Angleterre.
Les chercheurs ont analysé dans quelle mesure l'ajout de données météo et de mobilité améliorait les prévisions. Ils voulaient aussi savoir si les modèles d'apprentissage machine pouvaient maintenir leur précision dans différentes situations.
Les données qu'ils ont utilisées comprenaient des infos sur les cas de COVID-19, les décès, les admissions à l'hôpital et les modèles de mobilité, ainsi que des données météo. La plupart de ces informations étaient disponibles publiquement. Les données d'admission à l'hôpital ont commencé à être suivies en mars 2020, et pour assurer la cohérence de leur analyse, les chercheurs ont inclus des données jusqu'à fin 2022.
Pour leurs prévisions, ils ont ajusté les chiffres des admissions à l'hôpital en fonction de la taille de la population dans chaque région, ce qui leur a permis de comparer équitablement les taux entre les zones. Ils ont catégorisé les hospitalisations en différents niveaux, les niveaux supérieurs indiquant une plus grande demande hospitalière.
Collecte de données sur la mobilité et la météo
Les chercheurs ont collecté des Données de mobilité auprès de Google, qui a analysé les changements dans la manière dont les gens se déplaçaient pendant la pandémie. Ces données ont apporté des insights sur l'impact des confinements sur la vie quotidienne et les interactions des gens.
Pour rendre les données de mobilité compatibles avec les régions étudiées, les chercheurs les ont associées à des zones locales à l'aide d'une table de correspondance. Ils ont moyenné ces valeurs de mobilité quotidienne pour avoir une vue plus claire des tendances de déplacement au niveau régional. Les données météo, y compris la température et les précipitations, ont été obtenues d'une autre source et moyennées pour chaque région.
Création du modèle prédictif
Le modèle prédictif principal utilisé dans cette étude était basé sur une technique d'apprentissage machine appelée XGBoost. Cette méthode fonctionne généralement avec des données catégorisées de manière non ordonnée. Cependant, les chercheurs ont développé une façon de l'utiliser pour des données ordonnées. Ils ont transformé le problème de classification initial en plusieurs problèmes binaires, ce qui leur a permis de conserver plus d'infos et d'améliorer les prévisions.
Avec le nouveau modèle, ils ont aussi utilisé une méthode de régression logistique ordonnée plus traditionnelle comme référence pour comparer les résultats. Cette méthode est plus simple et sert de bon point de départ pour comprendre la relation entre les variables prédictives et les résultats.
Les chercheurs ont combiné différents types de données dans leurs modèles, tenant compte non seulement des infos sur les admissions à l'hôpital, mais aussi des données météo et de mobilité comme prédicteurs pour une meilleure précision.
Analyse des performances du modèle
Les chercheurs ont soigneusement analysé comment leurs modèles se comportaient dans la prédiction des admissions à l'hôpital. Ils ont particulièrement examiné les défis de la prévision à plus long terme, sachant que plus la prévision était éloignée, plus il était difficile de maintenir la précision.
Leurs résultats ont montré que le modèle utilisant uniquement des données épidémiologiques fonctionnait plutôt bien comparé aux méthodes plus traditionnelles. L'ajout de données de mobilité a encore amélioré le modèle, tandis que l'inclusion de données météo n'a pas significativement augmenté la précision.
En examinant diverses combinaisons de prédicteurs, il est devenu clair que les modèles intégrant des données de mobilité surpassaient systématiquement ceux qui s'appuyaient uniquement sur des données épidémiologiques. Au fur et à mesure que les chercheurs testaient différentes combinaisons de données, ils ont remarqué que les modèles utilisant à la fois des données de mobilité et de météo obtenaient souvent les meilleurs résultats.
Variations régionales et insights
En examinant les données d'admission à l'hôpital à travers différentes régions, les chercheurs ont découvert comment des modèles spécifiques ont émergé pendant la pandémie. Par exemple, au sommet de la vague du variant Alpha au début de 2021, les hospitalisations ont atteint un pic dans les régions du NHS. Après cela, les taux ont chuté au printemps et en été grâce aux confinements nationaux et aux efforts de vaccination.
Cependant, de nouveaux variants comme Delta et Omicron ont entraîné de nouvelles hausses d'hospitalisations, montrant comment des changements dans le virus pouvaient radicalement modifier les besoins en santé.
En analysant les prévisions résultantes, ils ont constaté que les modèles utilisant des données de mobilité avaient des erreurs de prévision plus faibles par rapport à ceux qui n'en utilisaient pas. L'impact de l'utilisation des données de mobilité est devenu plus évident avec le temps, surtout en examinant de plus près la relation entre les admissions à l'hôpital prévues et réelles.
Conclusion
Cette recherche met en avant l'importance de comprendre et de prévoir les niveaux d'admission à l'hôpital pendant la pandémie de COVID-19. En intégrant des données de mobilité et de météo avec des infos épidémiologiques traditionnelles, les chercheurs ont pu améliorer leur précision dans les prévisions des besoins hospitaliers.
Les insights tirés de cette étude peuvent aider les responsables de la santé publique à mieux planifier et affecter les ressources plus efficacement. Alors que le monde continue de naviguer à travers les défis posés par le COVID-19, avoir des modèles prédictifs fiables est crucial pour une gestion efficace des soins de santé et pour garantir que les communautés puissent répondre rapidement aux situations évolutives.
Titre: Forecasting regional-level COVID-19 hospitalisation in England as an ordinal variable using the machine learning method
Résumé: BackgroundCOVID-19 causes substantial pressure on healthcare, with many healthcare systems now needing to prepare for and mitigate the consequences of surges in demand caused by multiple overlapping waves of infections. Therefore, public health agencies and health system managers also now benefit from short-term forecasts for respiratory infections that allow them to manage services better. However, the availability of easily implemented effective tools for generating precise forecasts at the individual regional level still needs to be improved. MethodsWe extended prior work on influenza to forecast regional COVID-19 hospitalisations in England for the period from 19th March 2020 to 31st December 2022, treating the number of hospital admissions in each region as an ordinal variable. We further developed the XGBoost model used previously to forecast influenza to enable it to exploit the ordering information in ordinal hospital admission levels. We incorporated different types of data as predictors: epidemiological data including weekly region COVID-19 cases and hospital admissions, weather conditions and mobility data for multiple categories of locations (e.g., parks, workplaces, etc). The impact of different discretisation methods and the number of ordinal levels was also considered. ResultsWe find that the inclusion of weather data consistently increases the accuracy of our forecasts compared with models that rely only on the intrinsic epidemiological data, but only by a small amount. Mobility data brings about a more substantial increase in our forecasts. When both weather and mobility data are used in addition to the epidemiological data, the results are very similar to the model with only epidemiological data and mobility data. ConclusionAccurate ordinal forecasts of COVID-19 hospitalisations can be obtained using XGBoost and mobility data. While uniform ordinal levels show higher apparent accuracy, we recommend N-tile ordinal levels which contain far richer information. Author SummaryAt the regional level, we address the pressing need for precise short-term forecasts of respiratory infections, particularly COVID-19. We focus on the specific context of England and cover the period from January 1 to December 31, 2022. We introduced an enhanced XGBoost model that leverages the ordinal nature of hospital admission data, utilising a combination of predictors, including epidemiological data, weather conditions, and mobility data across various location categories. Our findings indicate that the inclusion of weather data marginally improves forecasting accuracy, while mobility data yields more significant enhancements. This research contributes valuable insights for public health agencies and healthcare system managers in their ongoing efforts to manage and respond to the complexities of the COVID-19 pandemic.
Auteurs: Steven Riley, H. Wang, K. O. Kwok, R. Li
Dernière mise à jour: 2023-10-17 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2023.10.17.23297138
Source PDF: https://www.medrxiv.org/content/10.1101/2023.10.17.23297138.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.