Collegare i dati sulla salute: OMOP e genomica
Scopri come l'OMOP CDM trasforma la condivisione dei dati sulla salute e la medicina di precisione.
Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut
― 6 leggere min
Indice
- Qual è il punto dell'OMOP CDM?
- Entra la comunità OHDSI e i suoi eroi
- Un'iniziativa spagnola per la medicina di precisione
- Trasformare i dati OMOP CDM in Beacon v2
- L'approccio basato su file: Cucina in anticipo
- L'approccio in tempo reale: Nessuna attesa
- Testare le acque: Conversione dei dati nel mondo reale
- Conversione basata su file al CNAG
- Conversione basata su file all'IIS La Fe
- Conversione basata su file all'Hospital del Mar
- Un confronto dei metodi di cottura
- Quando cucinare in anticipo
- Quando ordinare in tempo reale
- Conclusione: Una partnership per la salute
- Fonte originale
- Link di riferimento
Nel mondo di oggi, i dati sulla salute stanno crescendo a un ritmo impressionante, soprattutto per quanto riguarda le informazioni genomiche e cliniche. Questi dati possono aiutare i medici a fornire trattamenti più personalizzati su misura per le esigenze di ogni paziente. Tuttavia, c'è un problema: condividere questi dati tra diversi sistemi può essere complicato, come cercare di assemblare un puzzle con pezzi mancanti. Qui entra in gioco un framework chiamato OMOP Common Data Model (CDM). Pensalo come una lingua universale per i dati clinici che rende più facile la comunicazione tra diversi sistemi.
Qual è il punto dell'OMOP CDM?
L'OMOP CDM mira a organizzare i dati clinici in modo standardizzato. È ampiamente accettato e supportato da un gruppo conosciuto come OHDSI. Hanno un vocabolario standardizzato che aiuta a categorizzare un'ampia gamma di informazioni sanitarie. L'obiettivo? Assicurarsi che, indipendentemente da dove provengano i dati (da un ospedale di ricerca in Spagna o da una clinica negli Stati Uniti), tutti parlino la stessa lingua. Immagina conversazioni fluide senza pause imbarazzanti o malintesi.
Ma l'OMOP CDM ha un piccolo problema: non gestisce molto bene i dati genomici. E questo è un problema grosso perché le informazioni genomiche sono fondamentali per la medicina personalizzata, che cerca di adattare i trattamenti ai profili genetici individuali.
Entra la comunità OHDSI e i suoi eroi
Per affrontare questa carenza, la comunità OHDSI ha riunito un team di esperti dedicati a migliorare l'OMOP CDM. Vogliono garantire che i dati genomici possano integrarsi senza problemi nel mix. Questo sforzo fa parte di una missione globale più ampia per migliorare la condivisione e la collaborazione dei dati sulla salute, grazie a iniziative come la Global Alliance for Genomics and Health (GA4GH).
GA4GH ha introdotto alcuni strumenti utili come gli standard Beacon v2 e Phenopacket v2 per la condivisione di dati genomici e fenotipici. Pensali come messaggi di testo standardizzati che assicurano che le tue emoji non sembrino strane quando vengono inviate da un modello di telefono all'altro.
Un'iniziativa spagnola per la medicina di precisione
In Spagna, il programma IMPaCT mira a prendere sul serio la medicina di precisione. Vuole incorporare i più recenti progressi nella salute genomica nel Sistema Sanitario Nazionale, garantendo che tutti abbiano accesso a trattamenti di alta qualità. Una parte di questo programma si chiama IMPaCT-Data, che unisce diversi set di dati, rendendo più facile trovare i dati genomici e fenotipici giusti.
Trasformare i dati OMOP CDM in Beacon v2
Quindi, come facciamo a trasformare i dati dell'OMOP CDM per adattarli al formato Beacon v2? Beh, questo articolo rivela due approcci principali: un metodo basato su file e un metodo in tempo reale. Uno di essi è come preparare uno stufato sostanzioso in anticipo, mentre l'altro è cucinare un pasto fresco proprio quando hai fame.
L'approccio basato su file: Cucina in anticipo
Il metodo di conversione basato su file funziona in modo abbastanza efficiente per i centri che usano database non relazionali, come MongoDB. Qui, grandi volumi di dati dei pazienti vengono pre-trasformati in un formato compatibile con Beacon, facilitando l'accesso rapido e diretto. Immagina uno chef che prepara tutti gli ingredienti per un pasto delizioso la sera prima. Questo metodo è ottimo quando i ricercatori devono accedere ai dati rapidamente, ma richiede alcuni aggiornamenti periodici per mantenere tutto fresco.
Per far partire questo processo, i dati vengono esportati da un database relazionale e trasformati in formato JSON. Una volta convertiti, questi dati possono essere ordinatamente memorizzati in un database non relazionale dove possono essere accessibili tramite l'API Beacon v2. È come avere la tua zuppa pronta quando vuoi un pasto veloce!
L'approccio in tempo reale: Nessuna attesa
D'altra parte, il metodo in tempo reale adotta un approccio più dinamico. Invece di preparare i dati in anticipo, si collega direttamente al database OMOP CDM quando qualcuno ha bisogno di accedere alle informazioni. Pensalo come un food truck che cucina piatti gourmet proprio davanti a te.
Ogni volta che arriva una richiesta, il sistema traduce quelle richieste in query SQL per ottenere i dati richiesti dal database. Questo approccio è eccellente per situazioni che richiedono le informazioni più aggiornate, come quando nuovi dati sui pazienti arrivano quotidianamente. Tuttavia, richiede un database ben organizzato per funzionare senza intoppi. È un equilibrio tra velocità ed efficienza progettato per l'accesso in tempo reale.
Testare le acque: Conversione dei dati nel mondo reale
Per vedere quanto bene funzionano questi metodi nel mondo reale, hanno condotto test utilizzando varie fonti di dati sanitari in Spagna. Hanno utilizzato set di dati da cose come i registri dei pazienti COVID-19 per comprendere l'efficacia delle loro procedure di conversione.
Conversione basata su file al CNAG
Ad esempio, presso il Centro Nacional de Análisis Genómico (CNAG), hanno utilizzato il set di dati EUNOMIA, che contiene registri di migliaia di pazienti. Trasformando questi dati nel formato Beacon v2, hanno potuto avere un quadro chiaro della salute dei pazienti e condividere queste informazioni con altri ricercatori.
Conversione basata su file all'IIS La Fe
Successivamente, hanno testato il metodo basato su file presso l'Health Research Institute Hospital La Fe. Qui, hanno raccolto informazioni cliniche da pazienti COVID-19. L'obiettivo era convertire questi dati nel formato Beacon v2, consentendo ai ricercatori di interrogare facilmente caratteristiche sanitarie specifiche. E proprio come cuocere biscotti, i risultati finali erano deliziosamente completi di informazioni!
Conversione basata su file all'Hospital del Mar
All'Hospital del Mar, hanno sfruttato un enorme database che ha informazioni su circa un milione di pazienti. Utilizzando il database IMASIS, sono riusciti a convertire i dati nel formato Beacon v2 mantenendo un'accuratezza quasi perfetta. È fantastico quanto si possa ottenere da una così vasta collezione di dati!
Un confronto dei metodi di cottura
Lo studio esamina anche i pro e i contro di entrambi i metodi di conversione.
Quando cucinare in anticipo
L'approccio basato su file è meglio per i centri che trovano valore nell'accesso a dati preformattati. È particolarmente adatto per progetti che combinano informazioni da più fonti. Un grande vantaggio qui è il tempo di risposta rapido, rendendolo perfetto quando i ricercatori sono pronti a scavare nei loro dati.
Quando ordinare in tempo reale
La conversione in tempo reale brilla quando avere le informazioni più aggiornate è fondamentale. Previene la necessità di aggiornamenti periodici e bypassa il fastidio di mantenere dati duplicati. Tuttavia, dipende da un database veloce e ben organizzato per funzionare al meglio.
Conclusione: Una partnership per la salute
Entrambi i metodi contribuiscono a rendere la condivisione dei dati sulla salute più facile ed efficiente. Offrendo soluzioni semplici per la conversione dei dati sulla salute, aiutano le comunità di ricerca a unirsi, favorendo la collaborazione e, infine, favorendo i progressi nella medicina di precisione.
Scherzi a parte, quando si tratta di salute, condividere dati è una questione seria. Con questi metodi in atto, siamo più vicini a un mondo in cui le informazioni sulla salute fluiscono liberamente, rendendo più facile per i fornitori di assistenza sanitaria offrire la migliore cura possibile ai loro pazienti. Ecco a quel futuro—e magari un po' di zuppa a lato!
Titolo: Enhancing Semantic Interoperability in Precision Medicine: Converting OMOP CDM to Beacon v2 in the Spanish IMPaCT- Data Project
Estratto: ObjectiveTo introduce novel methods to convert OMOP CDM data into GA4GH Beacon v2 format, enhancing semantic interoperability within Spains IMPaCT-Data program for personalized medicine. Materials and MethodsWe utilized a file-based approach with the Convert-Pheno tool to transform OMOP CDM exports into Beacon v2 format. Additionally, we developed a direct connection from PostgreSQL OMOP CDM to the Beacon v2 API, enabling real-time data access without intermediary text files. ResultsWe successfully converted OMOP CDM datasets from three research centers (CNAG, IIS La Fe, and HMar) to Beacon v2 format with nearly 100% data completeness. The direct connection approach improved data freshness and adaptability for dynamic environments. Discussion and ConclusionThis study introduces two methodologies for integrating OMOP CDM data with Beacon v2, offering performance optimization or real-time access. These methodologies can be adopted by other centers to enhance interoperability and collaboration in health data sharing.
Autori: Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut
Ultimo aggiornamento: 2024-12-28 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://github.com/OHDSI/Genomic-CDM
- https://impact.isciii.es/
- https://impact-data.bsc.es/en/about/impact
- https://3tr-imi.eu/
- https://github.com/CNAG-Biomedical-Informatics/omop-cdm-2-beacon-v2
- https://gitlab.bsc.es/impact-data/impd-beacon_omopcdm
- https://ohdsi.github.io/Eunomia/
- https://www.sjdhospitalbarcelona.org/es/hospital/proyectos-estrategicos/red-unicas-atencion-enfermedades-minoritarias
- https://by-covid.org/
- https://www.gcatbiobank.org/