Simple Science

Scienza all'avanguardia spiegata semplicemente

# Scienze della salute# Informatica sanitaria

Semplificare la Ricerca sulla Salute con il pacchetto allofus R

Un nuovo strumento migliora l'accesso ai dati per i ricercatori nel campo della salute.

― 7 leggere min


Trasformare l'accessoTrasformare l'accessoalla ricerca sulla salutegestione dei dati per i ricercatori.Nuovo pacchetto R semplifica la
Indice

Il programma di ricerca All of Us è un progetto lanciato dagli Istituti Nazionali della Salute (NIH) con l'obiettivo di migliorare l'assistenza sanitaria. Si concentra sulla medicina di precisione, che significa personalizzare il trattamento medico in base alle caratteristiche individuali di ciascun paziente. Questo programma raccoglie un'ampia gamma di informazioni da partecipanti diversi in tutto gli Stati Uniti. Le informazioni includono dati sulla salute, scelte di vita, informazioni genetiche e dati da dispositivi indossabili. Questa varietà di dati aiuta i ricercatori a esaminare diversi fattori che influenzano la salute e a far progredire la ricerca medica personalizzata.

Raccolta e accessibilità dei dati

I dati raccolti da questo programma di ricerca sono organizzati in una struttura chiamata Common Data Model (CDM) dell'Osservational Medical Outcomes Partnership (OMOP). Questo sistema è progettato per standardizzare e semplificare il modo in cui vengono analizzati i dati sulla salute. Organizzando i dati provenienti da diverse fonti in un unico formato, diventa più facile per i ricercatori studiare le informazioni e fare confronti.

Una volta organizzati i dati e applicate le protezioni della privacy, vengono memorizzati in un Curated Data Repository (CDR). I ricercatori possono accedere a questi dati tramite l'All of Us Researcher Workbench, una piattaforma online collaborativa. Qui, i ricercatori hanno strumenti per creare spazi di lavoro, eseguire script di analisi e accedere a potenza di calcolo. I dati possono essere elaborati utilizzando linguaggi di programmazione popolari come R e Python attraverso interfacce user-friendly.

Nonostante l'accessibilità dei dati, ci sono ancora alcune sfide. I ricercatori spesso devono avere solide competenze di programmazione per lavorare con i dati in modo efficiente. Questa esigenza può rallentare il lavoro di ricerca e portare a errori, soprattutto per chi non è ben addestrato nella programmazione. Il progetto All of Us mira a superare queste sfide e garantire che chiunque, indipendentemente dal proprio background, possa contribuire alla ricerca.

Affrontare le sfide della ricerca

Per semplificare il processo di ricerca, è stato sviluppato un nuovo strumento chiamato pacchetto R allofus. Questo pacchetto è progettato per aiutare i ricercatori ad accedere e analizzare i dati di All of Us in modo più efficace. I suoi obiettivi principali includono semplificare la connessione al database, aiutare gli utenti a gestire facilmente i file e consentire l'uso di pacchetti R popolari per l'analisi dei dati.

Il pacchetto R allofus offre varie funzioni che affrontano problemi comuni riscontrati quando si lavora con i dati di All of Us. Ad esempio, consente agli utenti di connettersi direttamente al database ed eseguire query SQL senza dover scrivere codice complicato. I ricercatori possono anche estrarre e gestire facilmente dati da sondaggi e cartelle cliniche elettroniche (EHR). Inoltre, il pacchetto fornisce strumenti per creare coorti di partecipanti in base a specifiche condizioni di salute o caratteristiche.

Funzionalità chiave del pacchetto R allofus

Il pacchetto R allofus è incentrato sull'aiutare i ricercatori a gestire i propri dati utilizzando funzioni familiari presenti nella programmazione R. Funziona particolarmente bene con l'ecosistema tidyverse, un set popolare di pacchetti in R che semplificano l'analisi dei dati.

Connessione al database

Per analizzare i dati di All of Us, i ricercatori devono connettersi al database centralizzato dove sono memorizzate le informazioni. Il pacchetto R allofus semplifica questo processo di connessione, consentendo ai ricercatori di accedere facilmente ai dati. Una volta connessi, gli utenti possono eseguire query per recuperare i dati necessari.

Scrivere query

Il pacchetto allofus aiuta i ricercatori a scrivere query per estrarre dati dal database di All of Us. Utilizzando il pacchetto, i ricercatori possono utilizzare la sintassi familiare del pacchetto dplyr, che fa parte del tidyverse. Questo rende più facile manipolare e analizzare i dati. Il pacchetto include anche funzionalità che aiutano a gestire query complesse, garantendo che i ricercatori possano recuperare in modo efficiente i dati di cui hanno bisogno.

Gestione dei dati dei sondaggi e delle EHR

Il pacchetto è progettato per lavorare con i dati dei sondaggi e delle EHR, che sono essenziali per comprendere la salute dei partecipanti. Utilizzando il pacchetto allofus, i ricercatori possono facilmente cercare condizioni di salute specifiche e risposte ai sondaggi. Le funzioni incluse nel pacchetto sono state sviluppate per gestire le complessità dei dati dei sondaggi, come le risposte mancanti e le variazioni nei formati delle domande.

Creazione di coorti

Un'altra funzionalità importante del pacchetto R allofus è la sua capacità di aiutare i ricercatori a creare coorti. Una coorte è un gruppo di partecipanti che condividono caratteristiche o condizioni di salute specifiche. I ricercatori possono utilizzare il pacchetto per definire queste coorti in base a vari criteri, semplificando lo studio di problemi di salute specifici.

Gestione dei file

Oltre all'analisi e alla gestione dei dati, il pacchetto R allofus include funzioni che semplificano la gestione dei file. I ricercatori spesso devono gestire numerosi file quando lavorano a progetti, e il pacchetto fornisce strumenti per elencare, copiare e organizzare questi file all'interno dell'ambiente Researcher Workbench.

Accessibilità per tutti i ricercatori

Uno degli obiettivi principali del pacchetto R allofus è rendere il programma di ricerca All of Us accessibile a un numero maggiore di ricercatori. Questo include anche coloro che potrebbero non avere molta esperienza in programmazione. Il pacchetto è stato progettato per semplificare la manipolazione e l'analisi dei dati, consentendo agli utenti di concentrarsi sulle loro domande di ricerca senza essere sopraffatti da barriere tecniche.

Lo sviluppo del pacchetto R allofus è nato dalle esperienze di ricercatori che hanno riconosciuto le sfide che molti affrontavano nell'utilizzo dell'All of Us Researcher Workbench. Affrontando queste sfide, il pacchetto mira a promuovere un ambiente di ricerca più inclusivo.

Direzioni future

Guardando al futuro, ci sono diverse opportunità per il pacchetto R allofus di crescere e evolversi. Aree chiave per lo sviluppo futuro includono:

Migliorare l'interoperabilità

Il pacchetto R allofus mira ad aumentare la sua compatibilità con altri strumenti utilizzati nella ricerca sanitaria, come ATLAS e Phenotype Library. Questo miglioramento consentirà ai ricercatori di sfruttare ulteriori risorse e continuare a migliorare le loro analisi.

Affrontare i pregiudizi nei dati

Un altro focus cruciale per lo sviluppo futuro è la necessità di valutare e mitigare i pregiudizi all'interno dei dati di All of Us. Mentre il programma cerca di garantire rappresentanza tra i gruppi sottorappresentati, affrontare il bias di partecipazione e i dati mancanti rimane essenziale. Nuove funzionalità del pacchetto mireranno a trattare questi problemi, consentendo ai ricercatori di condurre analisi più rigorose.

Espandere le fonti di dati

Attualmente, il pacchetto R allofus si concentra sui dati dei sondaggi e delle EHR. Tuttavia, l'obiettivo è espandere la sua funzionalità per includere altre fonti di dati, come dati di misurazioni fisiche, dati di tracker fitness indossabili e informazioni genetiche. Allargando l'ambito dei dati disponibili per l'analisi, i ricercatori possono approfondire le loro indagini su vari aspetti della salute.

Conclusione

Il pacchetto R allofus rappresenta un passo significativo verso la creazione di un programma di ricerca All of Us più accessibile e user-friendly per una comunità diversificata di ricercatori. Riducendo il carico tecnico e migliorando la gestione dei dati, il pacchetto incoraggia la collaborazione e aumenta la produttività della ricerca.

Man mano che il pacchetto continua a svilupparsi, ha il potenziale per svolgere un ruolo essenziale nel far avanzare la ricerca sulla salute e promuovere preziose intuizioni sulla salute e il benessere individuali. Facilitando ricerche rigorose e riproducibili, il pacchetto R allofus si sforza di restituire valore alla comunità e rafforzare gli obiettivi del programma di ricerca All of Us.

Fonte originale

Titolo: allofus: An R package to facilitate use of the All of Us Researcher Workbench

Estratto: ObjectiveWe aimed to increase research and training capacity for the All of Us community through an R package designed to reduce barriers to entry to the Researcher Workbench. Materials and MethodsWe developed the open-source R package allofus, available on the R package repository CRAN. The package provides functions that address common challenges we encountered while working with All of Us Research Program data. We tested the package with standard R unit tests and in real research projects. ResultsWe describe how the package functions allow for an efficient workflow. We demonstrate the packages utility by creating a cohort of All of Us participants with one year of electronic health record data prior to survey completion and no previous diagnosis of Type 2 diabetes. DiscussionDespite the programs easy-to-use tools like the Cohort Builder, using All of Us data for complex research questions requires a relatively high level of technical expertise. We developed an initial set of functions that solve problems we experienced with our own research and in mentoring student projects. In conjunction with the tutorials provided with the package, these tools can reduce the barrier for entry into the All of Us research community. The package will continue to grow and develop with the All of Us Research Program. ConclusionThe allofus R package can help build community research capacity by increasing access to the All of Us Research Program data, the efficiency of its use, and the rigor and reproducibility of the resulting research.

Autori: Louisa H Smith, R. Cavanaugh

Ultimo aggiornamento: 2024-04-12 00:00:00

Lingua: English

URL di origine: https://www.medrxiv.org/content/10.1101/2024.04.10.24305611

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.04.10.24305611.full.pdf

Licenza: https://creativecommons.org/licenses/by-nc/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili