Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Économie de la santé

Prédire l'hésitation vaccinale grâce à l'analyse de données

Une nouvelle méthode prédit l'hésitation face au vaccin au niveau du code postal.

― 10 min lire


Modèle de prévision deModèle de prévision del’hésitation vaccinaleun niveau local.Un nouveau modèle prédit l'hésitation à
Table des matières

Les maladies très contagieuses comme la rougeole peuvent être évitées grâce aux vaccins. Le vaccin rougeole, oreillons et rubéole (ROR) est super efficace pour stopper ces maladies. Les écoles publiques dans plusieurs endroits, y compris aux États-Unis, exigent ce vaccin pour les élèves. La rougeole a même été déclarée « éliminée » aux États-Unis en 2000. Mais ces dernières années, il y a eu plus de foyers de rougeole, en partie parce que moins d'enfants se font vacciner. Par exemple, il y a eu une grosse épidémie à New York en 2019, avec plus de 900 cas. Au Nigeria, plus de 10 000 cas ont été signalés en 2021, et dans le monde entier, la rougeole a causé 128 000 décès cette même année. La pandémie de COVID-19 a aggravé la situation en rendant plus difficile l'accès aux vaccinations pour les enfants.

La baisse des taux de vaccination peut être attribuée à plusieurs raisons, la réticence vaccinale étant une des principales. Même avant la pandémie, environ 95 % des enfants de maternelle recevaient le vaccin ROR, mais cette couverture était inégale à travers le pays, avec certaines zones affichant des taux de vaccination bas. Pendant la pandémie, les vaccinations de routine ont pris un gros coup, et des millions d'enfants ont raté leur première dose du vaccin contre la rougeole. Aujourd'hui, la rougeole est considérée comme une menace sérieuse au niveau mondial.

La réticence vaccinale est un problème de santé publique croissant. Comprendre où et pourquoi cette réticence se manifeste est essentiel car elle peut entraîner des épidémies de maladies évitables. Malheureusement, les données sur les taux de vaccination ne sont souvent disponibles qu'à une échelle plus large, comme par État, ce qui rend difficile d'identifier les zones qui ont besoin d'aide. Certains États proposent des rapports sur les enquêtes de vaccination scolaires, mais ceux-ci sont généralement limités à des tranches d'âge spécifiques et ne tiennent pas compte de nombreux enfants, y compris ceux qui sont instruits à domicile.

Analyser la Réticence Vaccinale

Ce papier vise à créer des méthodes pour prédire la réticence vaccinale par code postal, en se concentrant sur les enfants de 0 à 6 ans. Les recherches montrent que l'adhésion au vaccin pour ce groupe d'âge peut refléter l'opinion des parents sur les vaccins. Ces jeunes enfants sont censés recevoir plusieurs vaccins obligatoires, y compris le ROR, l'HepB (Hépatite B) et le DTaP (Diphtérie, Tétanos et Coqueluche). Un aspect unique de cette étude est l'utilisation d'un grand ensemble de données provenant de Demandes d'assurance en Virginie, couvrant plus de 5 millions d'individus sur cinq ans.

La recherche sur la réticence vaccinale examine souvent les données des réseaux sociaux pour comprendre les attitudes et les facteurs qui influencent la réticence. Cependant, ces sources peuvent être biaisées en fonction des utilisateurs de différentes plateformes. Certaines études plus récentes s'appuient sur des données au niveau individuel, ce qui peut être difficile à généraliser. Notre travail aborde des recherches pertinentes sur la modélisation de la réticence vaccinale.

Nos Contributions

On présente une nouvelle approche-VH-GNN-qui combine un réseau neuronal graphique et un réseau neuronal récurrent. Cette méthode utilise des Données démographiques, des données historiques sur la réticence et des données détaillées sur les interactions dans les communautés. Le réseau neuronal graphique aide à capter comment la réticence vaccinale est influencée par les zones voisines, tandis que le réseau neuronal récurrent examine comment la réticence évolue dans le temps.

En formant et en évaluant le VH-GNN avec notre vaste ensemble de données sur les demandes d'assurance de Virginie, on a montré de meilleures performances par rapport à plusieurs autres méthodes. Notre approche réduit significativement les erreurs de prédiction entre 18,4 % et 43,4 %. Une étude d'ablation démontre que l'utilisation d'informations spatiales est cruciale pour améliorer les performances dans la prédiction de la réticence vaccinale.

Bien que le VH-GNN fonctionne bien dans l'ensemble, certains codes postaux affichent encore des erreurs de prédiction plus élevées. On a identifié certaines caractéristiques dans ces zones, comme le pourcentage d'enfants, le taux de réticence vaccinale, le pourcentage d'assurances Medicaid et le pourcentage de populations hispaniques.

Pour mieux comprendre les résultats, on a utilisé des métriques spécifiques pour évaluer à quel point les clusters sont similaires en termes de niveaux de réticence. On a découvert que les clusters de réticence vaccinale issus de nos Prédictions sont assez similaires aux niveaux de réticence réels dans notre ensemble de données.

Recherche Connexe

Les recherches sur la prédiction de la réticence vaccinale se divisent en deux grandes catégories : les études basées sur les données et celles basées sur des modèles. La plupart des études récentes utilisent des modèles d'apprentissage automatique pour identifier la réticence vaccinale locale et prédire les décisions individuelles. Cependant, celles-ci ne prennent pas en compte comment la réticence vaccinale se propage dans différentes zones. Il y a une tendance à ce que le refus de vaccination s'agrège dans certains quartiers, ce qui signifie qu'il est crucial de comprendre comment ces zones s'influencent mutuellement.

Des études récentes examinant la réticence au vaccin COVID-19 ont appliqué des méthodes de régression géographiquement pondérée pour expliquer les différences dans les taux de vaccination. Bien que certains modèles mathématiques abordent la réticence vaccinale, ils négligent souvent comment les connexions sociales varient.

Pour aborder les diverses influences du quartier et les changements au fil du temps liés à la réticence vaccinale, on utilise un cadre d'apprentissage profond basé sur les graphes. Ce cadre allie des éléments de réseaux neuronaux graphiques avec un module de séquence pour prédire la réticence pour chaque code postal. Chaque code postal sert de nœud, et les connexions entre eux représentent des relations basées sur divers facteurs.

Notre objectif est d'établir à quel point les individus sont hésitants vis-à-vis des vaccins au niveau du code postal. On utilise des données historiques sur la réticence et des caractéristiques démographiques de la population, ainsi que différents types de connexions entre les codes postaux.

Le Problème de la Réticence Vaccinale

Le principal défi ici est d'apprendre les niveaux de réticence vaccinale au fil du temps en se basant sur des données passées de réticence, des informations démographiques et des connexions entre les codes postaux. L'analyse des niveaux de réticence montre des variations significatives qui suggèrent qu'une approche spatiale est nécessaire.

Notre cadre, VH-GNN, comporte deux composants clés : un module spatial et un module de séquence. Le module spatial se concentre sur l'apprentissage de la façon dont les facteurs locaux influencent la réticence, tandis que le module de séquence est conçu pour étudier les changements au fil du temps.

Module Spatial

Dans ce module, on utilise un graphe statique pour illustrer comment les différents codes postaux sont connectés. On propose trois types de connectivité :

  1. Graphe d'Adjacence : Connecte les nœuds qui partagent une frontière.
  2. Graphe Basé sur la Distance : Connecte tous les codes postaux, la distance influençant la force de la connexion.
  3. Graphe de Mobilité : Indique les mouvements de population entre les zones.

Toutes les connexions et poids sont normalisés pour la cohérence.

Module de Séquence

Pour le module de séquence, on se concentre sur l'aspect temporel de la réticence vaccinale. L'entrée est une matrice qui prédit les niveaux de réticence au fil du temps. On utilise des unités récurrentes à portes (GRUs), connues pour leur efficacité dans le traitement des données séquentielles.

Les deux modules sont optimisés pour améliorer les prédictions concernant la réticence vaccinale.

Collecte de Données et Expérimentation

Pour analyser les niveaux de refus des patients en Virginie, on a utilisé un ensemble de données couvrant cinq ans de demandes d'assurance. Cet ensemble comprend des informations sur les demandes médicales payées pour environ 5 millions d'individus de différents types d'assurance.

On a filtré pour les enfants de six ans et moins et compilé un ensemble de données qui capture leurs caractéristiques uniques au fil du temps, y compris le sexe et la race.

Configuration Expérimentale

On a évalué le cadre en utilisant les techniques mentionnées plus haut et ajusté divers hyper-paramètres pour obtenir des performances optimales. On a fait des ajustements pour les taux d'apprentissage et les époques d'entraînement afin d'éviter le sur-apprentissage tout en garantissant un apprentissage efficace à travers les tests.

Métriques d'Évaluation

Pour évaluer la performance du cadre VH-GNN, on a utilisé deux métriques principales :

  • Erreur Quadratique Moyenne (RMSE)
  • Erreur Absolue Moyenne (MAE)

Des valeurs plus basses de ces métriques indiquent une meilleure précision dans les prédictions.

Comparaison des Résultats

On a comparé notre méthode à des approches traditionnelles comme la régression linéaire, le perceptron multicouche et les réseaux de neurones graphiques. Les résultats ont montré que le VH-GNN surpassait constamment ces méthodes de référence, notamment en 2019 et 2020.

De plus, on a évalué l'impact des différents mécanismes de connectivité sur la performance du modèle, découvrant que le graphe de mobilité offrait les meilleurs résultats.

Compréhension des Erreurs

On a catégorisé les nœuds en deux groupes en fonction de la précision des prédictions : ceux avec de grandes erreurs et ceux avec de petites erreurs. En analysant ces groupes, on a noté des différences significatives dans les démographies et les tailles, révélant que les zones avec des populations plus petites et des niveaux de réticence plus élevés posent souvent des défis plus importants pour la prédiction.

Capacité de Prévision

On a également testé à quel point le VH-GNN peut prévoir les niveaux de réticence futurs. Les résultats ont montré des valeurs RMSE et MAE prometteuses, indiquant des prédictions efficaces pour tous les codes postaux de Virginie.

Conclusion

Le cadre VH-GNN montre un potentiel pour prédire la réticence vaccinale au niveau du code postal. En combinant des approches basées sur les graphes et l'apprentissage de séquences, il intègre avec succès d'énormes ensembles de données pour améliorer la précision des prédictions. Ce travail met en lumière l'importance des facteurs géographiques et démographiques dans la compréhension de la réticence vaccinale et ouvre des voies pour des interventions ciblées et des stratégies visant à améliorer les taux de vaccination.

Source originale

Titre: A Graph Based Deep Learning Framework for Predicting Spatio-Temporal Vaccine Hesitancy

Résumé: Predicting vaccine hesitancy at a fine spatial level assists local policymakers in taking timely action. Vaccine hesitancy is a heterogeneous phenomenon that has a spatial and temporal aspect. This paper proposes a deep learning framework that combines graph neural networks (GNNs) with sequence module to forecast vaccine hesitancy at a higher spatial resolution. This integrated framework only uses population demographic data with historical vaccine hesitancy data. The GNN learns the spatial cross-regional demographic signals, and the sequence module catches the temporal dynamics by leveraging historical data. We formulate the problem on a weighted graph, where nodes are zip codes and edges are generated using three distinct mechanisms: 1) adjacent graph - if two zip codes have a shared boundary, they will form an edge between them; 2) distance-based graph - every pair of zip codes are connected with an edge having a weight that is a function of centroid distances, and 3) mobility graph - edges represent the number of contacts between any two zip codes, where the contacts are derived from an activity-based social contact network. Our framework effectively predicts the spatio-temporal dynamics of vaccine hesitancy at the zip-code level when the mobility network is used to formulate the graph. Experiments on the real-world vaccine hesitancy data from the All-Payer Claims Database (APCD) show that our framework can outperform a range of baselines.

Auteurs: Sifat afroj Moon, R. Datta, T. Ferdousi, H. Baek, A. Adiga, A. Marathe, A. Vullikanti

Dernière mise à jour: 2023-10-25 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2023.10.24.23297488

Source PDF: https://www.medrxiv.org/content/10.1101/2023.10.24.23297488.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires