Faire avancer la recherche sur la grossesse grâce à la collecte de données
Un aperçu complet de la recherche sur la grossesse grâce au programme All of Us.
― 10 min lire
Table des matières
La grossesse est super importante pour la santé humaine, mais ça n'a pas été étudié comme ça devrait l'être. Y'a plein de raisons pour ça, y compris les difficultés d'étudier les personnes enceintes et les problèmes éthiques qui viennent avec ce genre de recherches. Du coup, beaucoup de personnes enceintes sont laissées de côté dans les essais cliniques et les études. Résultat, les chercheurs doivent se baser sur des données d'observation pour examiner les effets de différents facteurs sur la grossesse et en apprendre plus sur les problèmes de santé liés à la grossesse, les comportements et les résultats. Mais faire des recherches sur la grossesse et la période après l'accouchement reste compliqué à cause des limites des données disponibles et des designs d'études.
Défis de la recherche sur la grossesse
Beaucoup d'études sur la grossesse ont utilisé des études de groupe coûteuses, qui ne suivent souvent pas toute la période de grossesse. Par exemple, les données gouvernementales sur les naissances peuvent donner des infos générales mais manquent souvent de détails sur le début de grossesse ou l'utilisation de médicaments. Les cohortes de naissance, qui sont des études d'observation se concentrant sur les personnes enceintes ou nouvellement accouchées, recrutent souvent des participants proche de la fin de leur grossesse. Ça rate des infos cruciales sur les premières expositions, comme les fausses couches.
Récemment, des chercheurs ont commencé à concevoir des études préconceptionnelles pour rassembler des données sur la fertilité, la grossesse et la santé post-accouchement dès le départ. Bien que ces études de cohorte puissent fournir des données précieuses sur le long terme, elles nécessitent beaucoup de ressources et dépendent souvent des auto-déclarations concernant le timing et les résultats de la grossesse. Par contre, les données du monde réel provenant de sources comme les dossiers de santé électroniques (DSE) et les demandes d'assurance contiennent des infos détaillées sur les diagnostics, les traitements et les coûts. Mais ces dossiers manquent souvent de détails démographiques clés et peuvent rendre difficile l'identification des Grossesses et la mesure précise de l'Âge gestationnel.
Le programme de recherche "All of Us"
Le programme de recherche "All of Us" représente une opportunité d'étudier la grossesse de manière plus efficace. Il collecte des données à travers les DSE, des enquêtes, des échantillons biologiques et des trackers d'activité. Cette approche soutient des études à long terme qui examinent à la fois les facteurs sociaux et médicaux influençant la santé. Le programme vise à inclure un large éventail de personnes, surtout celles qui ont été sous-représentées dans les recherches précédentes, comme les personnes enceintes, notamment celles issues de minorités.
Malgré les avantages potentiels du programme "All of Us", il y a encore des défis pour identifier et analyser les grossesses en utilisant des données du monde réel. Les différentes pratiques de codage, le fait que les patients voient plusieurs prestataires de soins et l'utilisation incohérente des codes pour l'âge gestationnel compliquent l'identification des épisodes de grossesse. Ça veut dire que les chercheurs peuvent pas compter sur un seul code pour confirmer une grossesse, et ils ont besoin d'algorithmes complexes pour identifier avec précision les grossesses, leurs résultats et les âges gestationnels.
Objectifs de la recherche
Les principaux objectifs de cette étude étaient de trouver des épisodes de grossesse dans les données "All of Us", d'inférer l'âge gestationnel et les résultats, de valider ces épisodes à l'aide de données d'enquête et de caractériser les grossesses identifiées. La recherche cherchait à montrer comment le programme "All of Us" peut être un outil précieux pour répondre à des questions liées à la grossesse qui sont importantes pour les chercheurs et les communautés qu'ils étudient.
Comment fonctionne le programme "All of Us"
Le programme de recherche "All of Us" a commencé à inscrire des participants adultes en 2018. Il a une stratégie de recrutement large à travers le pays, permettant à n'importe quel volontaire de participer. Les participants fournissent des informations démographiques via des enquêtes, y compris des détails sur leur historique de santé et leur contexte social. Ils peuvent aussi lier leurs données DSE, partager des échantillons biologiques et contribuer avec des données provenant de trackers de fitness.
Les données proviennent de nombreux établissements de santé avec différents systèmes de dossiers médicaux, qui sont ensuite normalisés dans un format de données commun pour faciliter l'analyse. Après des contrôles de qualité et des protections de la vie privée, les chercheurs qui remplissent des exigences de formation spécifiques peuvent accéder à ces données.
L'algorithme d'identification de grossesse
Pour trouver les grossesses parmi les participants du programme "All of Us", les chercheurs ont utilisé un algorithme spécifique développé et validé à l'aide d'autres données de santé. Cette méthode décompose le processus d'identification en trois parties : découvrir comment s'est terminée une grossesse, utiliser un ensemble de codes liés à l'évolution de la grossesse, et estimer la date de début de la grossesse.
L'algorithme commence par identifier les résultats de grossesse comme les naissances vivantes, les mortinaissances, les grossesses ectopiques, les avortements et les accouchements. Il organise cette info en fonction de la durée typique des grossesses. Il intègre également des codes fournissant des détails sur l'âge gestationnel. En fusionnant ces sources d'informations, les chercheurs peuvent créer une image plus claire des événements de grossesse.
Validation des résultats
Les chercheurs ont validé les épisodes de grossesse identifiés de deux manières : en comparant avec des données d'enquête et en vérifiant contre des codes supplémentaires liés à la grossesse qui n'étaient pas inclus dans l'algorithme initial. Ils ont regardé les réponses des participants concernant leur statut de grossesse actuel et ont comparé ces réponses aux épisodes identifiés pour déceler toute classification incorrecte.
En évaluant les données de cette manière, ils ont trouvé un haut niveau d'accord entre les réponses des enquêtes et les résultats de l'algorithme. Ça suggère que l'algorithme est fiable pour identifier les grossesses.
Caractérisation des épisodes de grossesse
L'étude a identifié de nombreux épisodes de grossesse et a pu examiner leurs résultats, leur durée, et les caractéristiques démographiques des personnes impliquées. Ils ont utilisé des modèles statistiques pour explorer divers facteurs qui pourraient être liés aux résultats de grossesse. La recherche visait aussi à comprendre combien de données supplémentaires les participants avaient apportées au programme, y compris les réponses aux enquêtes et les données des trackers.
Démographie des participants
Parmi les participants identifiés avec des épisodes de grossesse, une part significative appartenait à des groupes minoritaires. Plus de 40 % s'identifiaient comme hispaniques ou latinos, tandis que plus de 30 % étaient blancs. La plupart des participants se déclaraient femmes, et une majorité s'identifiait comme hétérosexuelle.
La recherche a montré diverses caractéristiques corrélées à avoir plusieurs épisodes de grossesse, à la probabilité d'avoir une naissance vivante, et aux chances de donner naissance prématurément. Par exemple, les personnes avec des revenus plus élevés étaient plus susceptibles d'avoir enregistré plus d'un épisode de grossesse, et les participants plus âgés étaient plus susceptibles d'avoir des naissances prématurées.
Insights sur les naissances vivantes
Les résultats concernant les naissances vivantes ont indiqué que l'âge gestationnel moyen était de 39 semaines, avec environ un cinquième des naissances se produisant prématurément. En comparant les données démographiques du programme "All of Us" avec les statistiques nationales, il était évident qu'il existait certaines différences. Par exemple, les personnes donnant naissance par le biais du programme avaient tendance à être légèrement plus âgées et mieux éduquées que la moyenne nationale.
Potentiel et promesse des données "All of Us"
Les problèmes de santé maternelle deviennent de plus en plus pressants, surtout compte tenu des taux croissants de complications et des disparités entre différents groupes raciaux et ethniques. En combinant des dossiers médicaux avec des informations d'enquête détaillant les comportements de santé et les facteurs sociaux, le programme "All of Us" peut fournir de nouvelles perspectives sur les expériences de grossesse et la santé postpartum. Cela peut finalement aider les chercheurs à comprendre et à résoudre les causes profondes des disparités en matière de santé.
De plus, le programme a inclus un nombre significatif de participants qui ont rempli des enquêtes pendant leur grossesse, permettant aux chercheurs de suivre leurs expériences de santé dans la période postpartum. Ça offre plein d'opportunités pour explorer les liens entre les facteurs sociaux, les expériences de discrimination, et les Résultats de santé tant pendant la grossesse qu'après.
Exploiter d'autres sources de données
Le programme collecte aussi d'autres types de données, comme des informations génétiques et des données d'activité physique provenant de trackers portables, ce qui peut aider à répondre à des questions cruciales sur la grossesse. Par exemple, comprendre ce qui cause des naissances prématurées est un problème complexe, et intégrer ces données diverses pourrait mener à de nouvelles découvertes.
Forces et limitations
Bien que les données du monde réel provenant des DSE offrent une vue d'ensemble sur les grossesses et les caractéristiques de santé associées sur de nombreuses années, il y a des limites. Les erreurs de codage peuvent entraîner des lacunes ou des inexactitudes dans les dossiers des patients. De plus, le fait que les patients reçoivent des soins de différents systèmes de santé peut créer des dossiers fragmentés qui obscurcissent des infos de santé importantes.
Malgré ces défis, l'étude a démontré que les données du programme "All of Us" et l'algorithme d'identification de grossesse offrent une base plus solide pour la recherche que de se fier uniquement aux recherches de codes traditionnelles. En utilisant ces nouvelles méthodes, les études futures peuvent se concentrer sur la compréhension plus approfondie des expériences de grossesse.
Directions futures
Reconnaître le timing des contributions de données est crucial pour les études liées à la grossesse. Beaucoup de grossesses identifiées dans l'ensemble de données "All of Us" se sont produites avant que les participants rejoignent le programme, ce qui peut limiter les opportunités de recherche qui nécessitent des données recueillies pendant la grossesse elle-même. Cependant, certaines réponses aux enquêtes peuvent encore être liées aux données DSE, peu importe le timing.
Bien que le programme "All of Us" s'efforce d'inclure une population diversifiée, il se peut qu'il ne représente pas totalement toutes les communautés. Les chercheurs doivent prendre en compte les biais potentiels dans leurs études pour garantir des résultats justes et précis.
En résumé, cette approche innovante pour étudier la grossesse à travers le programme "All of Us" permet aux chercheurs de recueillir des informations complètes sur la santé des personnes enceintes et leurs expériences, ce qui peut finalement conduire à de meilleurs résultats en matière de santé maternelle et infantile.
Titre: Pregnancy episodes in All of Us: Harnessing multi-source data for pregnancy-related research
Résumé: ObjectiveThe National Institutes of Healths All of Us Research Program addresses gaps in biomedical research by collecting health data from diverse populations. Pregnant individuals have historically been underrepresented in biomedical research, and pregnancy-related research is often limited by data availability, sample size, and inadequate representation of the diversity of pregnant people. We aimed to identify pregnancy episodes with high-quality electronic health record (EHR) data in All of Us Research Program data and evaluate the programs utility for pregnancy-related research. Materials and MethodsWe used an algorithm to identify pregnancy episodes in All of Us EHR data. We described these pregnancies, validated them with additional data, and compared them to national statistics. ResultsOur study identified 18,970 pregnancy episodes from 14,234 participants; other possible pregnancy episodes had low-quality or insufficient data. Validation against people who reported a current pregnancy on an All of Us survey found low false positive and negative rates. Demographics were similar in some respects to national data; however, Asian-Americans were underrepresented, and older, highly educated pregnant people were overrepresented. DiscussionOur approach demonstrates the capacity of All of Us to support pregnancy research and reveals the diversity of the pregnancy cohort. However, we noted an underrepresentation among some demographics. Other limitations include measurement error in gestational age and limited data on non-live births. ConclusionThe wide variety of data in the All of Us program, encompassing EHR, survey, genomic, and Fitbit data, offers a valuable resource for studying pregnancy, yet care must be taken to avoid biases.
Auteurs: Louisa H Smith, W. Wang, B. Keefe-Oates
Dernière mise à jour: 2024-04-12 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.04.10.24305609
Source PDF: https://www.medrxiv.org/content/10.1101/2024.04.10.24305609.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.