Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Informatique de santé

Simplifier la recherche en santé avec le paquet allofus R

Un nouvel outil améliore l'accès aux données pour les chercheurs en santé.

― 8 min lire


Transformer l'accès à laTransformer l'accès à larecherche en santéchercheurs.gestion des données pour lesUn nouveau package R simplifie la
Table des matières

Le programme de recherche All of Us est un projet lancé par les Instituts nationaux de la santé (NIH) qui vise à améliorer les soins de santé. Il se concentre sur la médecine de précision, ce qui signifie adapter le traitement médical aux caractéristiques individuelles de chaque patient. Ce programme collecte une large gamme d'informations auprès de participants divers à travers les États-Unis. Les informations comprennent des données de santé, des choix de mode de vie, des informations génétiques et des données provenant de dispositifs portables. Cette variété de données aide les chercheurs à examiner différents facteurs qui affectent la santé et à faire avancer la recherche médicale personnalisée.

Collecte de données et accessibilité

Les données collectées dans le cadre de ce programme de recherche sont organisées dans une structure appelée le modèle de données communes de l'Observational Medical Outcomes Partnership (OMOP CDM). Ce système est conçu pour standardiser et simplifier l'analyse des données de santé. En organisant les données provenant de différentes sources dans un même format, il devient plus facile pour les chercheurs d'étudier les informations et de faire des comparaisons.

Une fois que les données ont été organisées et que les protections de la vie privée ont été appliquées, elles sont stockées dans un dépôt de données organisées (CDR). Les chercheurs peuvent accéder à ces données via la plateforme en ligne All of Us Researcher Workbench, un espace collaboratif. Ici, les chercheurs ont des outils pour créer des espaces de travail, exécuter des scripts d'analyse et accéder à de la puissance de calcul. Les données peuvent être traitées à l'aide de langages de programmation populaires comme R et Python via des interfaces conviviales.

Malgré l'accessibilité des données, certains défis persistent. Les chercheurs doivent souvent avoir de solides compétences en programmation pour travailler efficacement avec les données. Cette exigence peut ralentir le travail de recherche et entraîner des erreurs, surtout pour ceux qui ne sont pas aussi bien formés en programmation. Le projet All of Us vise à surmonter ces défis et à s'assurer que tout le monde, indépendamment de son parcours, puisse contribuer à la recherche.

Aborder les défis de recherche

Pour faciliter le processus de recherche, un nouvel outil appelé le package R allofus a été développé. Ce package est conçu pour aider les chercheurs à accéder et à analyser les données d'All of Us plus efficacement. Ses principaux objectifs incluent simplifier la connexion à la base de données, aider les utilisateurs à gérer facilement les fichiers et permettre l'utilisation de packages R populaires pour l'analyse de données.

Le package R allofus propose diverses fonctions qui répondent aux problèmes courants rencontrés lors de l'utilisation des données d'All of Us. Par exemple, il permet aux utilisateurs de se connecter directement à la base de données et d'exécuter des requêtes SQL sans écrire de code compliqué. Les chercheurs peuvent également extraire et gérer facilement les données d'enquête et les dossiers de santé électroniques (EHR). De plus, le package fournit des outils pour créer des cohorts de participants en fonction de conditions de santé spécifiques ou de caractéristiques.

Fonctionnalités clés du package R allofus

Le package R allofus se concentre sur l'aide aux chercheurs pour gérer leurs données tout en utilisant des fonctions familières trouvées dans la programmation R. Il fonctionne particulièrement bien avec l'écosystème tidyverse, un ensemble populaire de packages en R qui facilitent l'analyse des données.

Connexion à la base de données

Pour analyser les données d'All of Us, les chercheurs doivent se connecter à la base de données centralisée où les informations sont stockées. Le package R allofus simplifie ce processus de connexion, permettant aux chercheurs d'accéder facilement aux données. Une fois connectés, les utilisateurs peuvent exécuter des requêtes pour récupérer les données nécessaires.

Écriture de requêtes

Le package allofus aide les chercheurs à écrire des requêtes pour extraire des données de la base de données All of Us. En utilisant le package, les chercheurs peuvent utiliser une syntaxe familière du package dplyr, qui fait partie du tidyverse. Cela rend la manipulation et l'analyse des données plus faciles. Le package comprend également des fonctionnalités qui aident à gérer des requêtes complexes, garantissant que les chercheurs peuvent récupérer efficacement les données dont ils ont besoin.

Gestion des données d'enquête et EHR

Le package est conçu pour travailler avec les données d'enquête et EHR, qui sont essentielles pour comprendre la santé des participants. En utilisant le package allofus, les chercheurs peuvent facilement rechercher des conditions de santé spécifiques et des réponses d'enquête. Les fonctions comprises dans le package sont conçues pour gérer les complexités des données d'enquête, comme les réponses manquantes et les variations dans les formats de questions.

Création de cohorts

Une autre fonctionnalité importante du package R allofus est sa capacité à aider les chercheurs à créer des cohorts. Une cohort est un groupe de participants qui partagent des caractéristiques ou des conditions de santé spécifiques. Les chercheurs peuvent utiliser le package pour définir ces cohorts en fonction de divers critères, facilitant ainsi l'étude de problèmes de santé spécifiques.

Gestion des fichiers

En plus de l'analyse et de la gestion des données, le package R allofus comprend des fonctions qui simplifient la gestion des fichiers. Les chercheurs doivent souvent gérer de nombreux fichiers lorsqu'ils travaillent sur des projets, et le package fournit des outils pour lister, copier et organiser ces fichiers dans l'environnement Researcher Workbench.

Accessibilité pour tous les chercheurs

Un des principaux objectifs du package R allofus est de rendre le programme de recherche All of Us accessible à un plus large éventail de chercheurs. Cela inclut ceux qui n'ont pas une grande expérience en programmation. Le package a été conçu pour simplifier la manipulation et l'analyse des données, permettant aux utilisateurs de se concentrer sur leurs questions de recherche sans être freinés par des barrières techniques.

Le développement du package R allofus découle des expériences de chercheurs qui ont reconnu les défis auxquels beaucoup étaient confrontés en utilisant l'All of Us Researcher Workbench. En abordant ces défis, le package vise à favoriser un environnement de recherche plus inclusif.

Directions futures

En regardant vers l'avenir, il y a plusieurs opportunités pour que le package R allofus se développe et évolue. Les domaines clés pour le développement futur incluent :

Amélioration de l'interopérabilité

Le package R allofus vise à augmenter sa compatibilité avec d'autres outils utilisés dans la recherche en santé, tels qu'ATLAS et la bibliothèque de phénotypes. Cette amélioration permettra aux chercheurs de tirer parti de ressources supplémentaires et de continuer à améliorer leurs analyses.

Traiter les biais dans les données

Un autre point crucial pour le développement futur est la nécessité d'évaluer et de réduire les biais au sein des données d'All of Us. Alors que le programme s'efforce d'assurer la représentation des groupes sous-représentés, traiter le biais de participation et les données manquantes reste essentiel. De nouvelles fonctionnalités du package viseront à aborder ces questions, permettant aux chercheurs de mener des analyses plus rigoureuses.

Extension des sources de données

Actuellement, le package R allofus met l'accent sur les données d'enquête et EHR. Cependant, l'objectif est d'élargir sa fonctionnalité pour inclure d'autres sources de données, telles que les données de mesure physique, les données de trackers de fitness portables et les informations génomiques. En élargissant le champ des données disponibles pour l'analyse, les chercheurs peuvent approfondir leurs enquêtes sur divers aspects de la santé.

Conclusion

Le package R allofus représente une étape significative vers la rendre le programme de recherche All of Us plus accessible et facile à utiliser pour une communauté de chercheurs diversifiée. En réduisant le fardeau technique et en améliorant la gestion des données, le package encourage la collaboration et améliore la productivité de recherche.

Alors que le package continue de se développer, il a le potentiel de jouer un rôle essentiel dans l'avancement de la recherche en santé et de promouvoir des aperçus précieux sur la santé et le bien-être individuels. En facilitant une recherche rigoureuse et reproductible, le package R allofus s'efforce de renvoyer de la valeur à la communauté et de renforcer les objectifs du programme de recherche All of Us.

Source originale

Titre: allofus: An R package to facilitate use of the All of Us Researcher Workbench

Résumé: ObjectiveWe aimed to increase research and training capacity for the All of Us community through an R package designed to reduce barriers to entry to the Researcher Workbench. Materials and MethodsWe developed the open-source R package allofus, available on the R package repository CRAN. The package provides functions that address common challenges we encountered while working with All of Us Research Program data. We tested the package with standard R unit tests and in real research projects. ResultsWe describe how the package functions allow for an efficient workflow. We demonstrate the packages utility by creating a cohort of All of Us participants with one year of electronic health record data prior to survey completion and no previous diagnosis of Type 2 diabetes. DiscussionDespite the programs easy-to-use tools like the Cohort Builder, using All of Us data for complex research questions requires a relatively high level of technical expertise. We developed an initial set of functions that solve problems we experienced with our own research and in mentoring student projects. In conjunction with the tutorials provided with the package, these tools can reduce the barrier for entry into the All of Us research community. The package will continue to grow and develop with the All of Us Research Program. ConclusionThe allofus R package can help build community research capacity by increasing access to the All of Us Research Program data, the efficiency of its use, and the rigor and reproducibility of the resulting research.

Auteurs: Louisa H Smith, R. Cavanaugh

Dernière mise à jour: 2024-04-12 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.04.10.24305611

Source PDF: https://www.medrxiv.org/content/10.1101/2024.04.10.24305611.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires