Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Informatique de santé

Relier les données de santé : OMOP et génomique

Découvre comment l'OMOP CDM transforme le partage des données de santé et la médecine de précision.

Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut

― 8 min lire


Transformer le partage deTransformer le partage dedonnées de santédonnées de santé sans accroc.Méthodes innovantes pour un échange de
Table des matières

Dans le monde d'aujourd'hui, les données de santé grandissent à une vitesse incroyable, surtout quand il s'agit d'infos génomiques et cliniques. Ces données peuvent aider les médecins à offrir des traitements plus personnalisés, adaptés aux besoins de chaque patient. Mais attention : partager ces données entre différents systèmes, c'est un peu comme essayer d'assembler un puzzle avec des pièces manquantes. C'est là qu'intervient un cadre appelé le Modèle de Données Commun OMOP (CDM). Pense à ça comme une langue universelle pour les données cliniques qui facilite la communication entre différents systèmes.

C'est quoi le truc avec OMOP CDM ?

Le OMOP CDM vise à organiser les données cliniques de manière standard. Il est largement accepté et soutenu par un groupe connu sous le nom de OHDSI. Ils ont un vocabulaire standardisé qui aide à catégoriser une vaste gamme d'informations de santé. L'objectif ? S'assurer que peu importe d'où viennent les données (un hôpital de recherche en Espagne ou une clinique aux États-Unis), tout le monde parle la même langue. Imagine des conversations qui coulent sans pauses gênantes ou malentendus.

Mais OMOP CDM a un petit souci : il ne gère pas très bien les données génomiques. Et ça, c'est assez important parce que les infos génomiques sont essentielles pour la médecine personnalisée, qui vise à adapter les traitements aux profils génétiques individuels.

La communauté OHDSI et ses héros

Pour remédier à ce problème, la communauté OHDSI a réuni une équipe d'experts dédiée à l'amélioration de l'OMOP CDM. Ils veulent s'assurer que les données génomiques peuvent s'intégrer parfaitement dans le mélange. Cet effort fait partie d'une mission mondiale plus large pour améliorer le partage et la collaboration des données de santé, grâce à des initiatives comme l'Alliance Mondiale pour la Génomique et la Santé (GA4GH).

GA4GH a introduit quelques outils pratiques comme les standards Beacon v2 et Phenopacket v2 pour partager des données génomiques et phénotypiques. Pense à ça comme des messages texte standardisés qui s'assurent que tes emojis ne paraissent pas bizarres quand ils sont envoyés d'un modèle de téléphone à un autre.

Une initiative espagnole pour la médecine de précision

En Espagne, le programme IMPaCT vise à prendre la médecine de précision au sérieux. Il cherche à intégrer les dernières avancées en matière de soins de santé génomiques dans le système de santé national, garantissant que tout le monde ait accès à des traitements de qualité. Une partie de ce programme s'appelle IMPaCT-Data, qui mélange des ensembles de données divers, rendant plus facile la recherche des bonnes données génomiques et phénotypiques.

Transformer les données OMOP CDM en Beacon v2

Alors, comment on transforme les données OMOP CDM pour qu'elles correspondent au format Beacon v2 ? Eh bien, cet article révèle deux approches principales : une méthode basée sur les fichiers et une méthode à la volée. L'une d'elles est comme préparer un bon ragoût à l'avance, tandis que l'autre est de cuisiner un repas frais juste quand tu as faim.

L'approche basée sur les fichiers : cuisiner à l'avance

La méthode de conversion basée sur les fichiers fonctionne de manière assez efficace pour les centres utilisant des bases de données non relationnelles, comme MongoDB. Ici, de gros volumes de données patients sont pré-transformés en un format compatible avec Beacon, rendant l'accès rapide et simple. Imagine un chef qui prépare tous les ingrédients pour un repas délicieux la veille. Cette méthode est géniale quand les chercheurs ont besoin d'accéder rapidement aux données, mais elle nécessite des mises à jour périodiques pour garder les choses fraîches.

Pour commencer ce processus, les données sont exportées d'une base de données relationnelle et converties en format JSON. Une fois converties, ces données peuvent être soigneusement stockées dans une base de données non relationnelle où elles peuvent être consultées via l'API Beacon v2. Comme avoir ta soupe prête à manger quand tu veux un repas rapide !

L'approche à la volée : pas d'attente

D'un autre côté, la méthode à la volée adopte une approche plus dynamique. Au lieu de préparer les données à l'avance, elle se connecte directement à la base de données OMOP CDM quand quelqu'un a besoin d'accéder à des informations. Pense à ça comme un food truck qui prépare des plats gastronomiques juste devant toi.

Chaque fois qu'une demande arrive, le système traduit ces demandes en requêtes SQL pour récupérer les données nécessaires dans la base de données. Cette approche est excellente pour les situations qui nécessitent les informations les plus récentes, comme quand de nouvelles données patients arrivent chaque jour. Cependant, cela nécessite une base de données bien organisée pour fonctionner sans accrocs. C'est un équilibre entre rapidité et efficacité taillé pour un accès en temps réel.

Tester les eaux : conversion de données réelles

Pour voir comment ces méthodes fonctionnent dans le monde réel, ils ont mené des tests en utilisant diverses sources de données de santé en Espagne. Ils ont utilisé des ensembles de données provenant de choses comme les dossiers de patients COVID-19 pour comprendre l'efficacité de leurs procédures de conversion.

Conversion basée sur les fichiers au CNAG

Par exemple, au Centro Nacional de Análisis Genómico (CNAG), ils ont utilisé l'ensemble de données EUNOMIA, qui contient des dossiers pour des milliers de patients. En transformant ces données au format Beacon v2, ils pouvaient obtenir une image claire de la santé des patients et partager cette information avec d'autres chercheurs.

Conversion basée sur les fichiers à l'IIS La Fe

Ensuite, ils ont testé la méthode basée sur les fichiers à l'Institut de Recherche en Santé de l'Hôpital La Fe. Ici, ils ont rassemblé des informations cliniques sur les patients COVID-19. L'objectif était de convertir ces données au format Beacon v2, permettant aux chercheurs d'interroger facilement des caractéristiques de santé spécifiques. Et tout comme la cuisson de cookies, les résultats finaux étaient délicieusement complets avec des informations !

Conversion basée sur les fichiers à l'Hôpital del Mar

À l'Hôpital del Mar, ils ont exploité une énorme base de données contenant des informations sur environ un million de patients. Grâce à la base de données IMASIS, ils ont réussi à convertir des données au format Beacon v2 tout en maintenant une précision presque parfaite. C'est incroyable de voir combien d'informations on peut tirer d'une telle collection de données !

Une comparaison des méthodes de cuisson

L'étude examine également les avantages et les inconvénients des deux méthodes de conversion.

Quand cuisiner à l'avance

L'approche basée sur les fichiers est meilleure pour les centres qui trouvent de la valeur dans l'accès à des données préformatées. Elle est particulièrement adaptée pour les projets qui combinent des informations de plusieurs sources. Un avantage majeur ici est les temps de réponse rapides, parfaits quand les chercheurs sont prêts à plonger dans leurs données.

Quand commander à la volée

La conversion à la volée brille quand avoir les informations les plus à jour est crucial. Ça évite d'avoir à faire des mises à jour périodiques et contourne le casse-tête de maintenir des données en double. Cependant, cela repose sur une base de données rapide et bien organisée pour fonctionner au mieux.

Conclusion : un partenariat pour la santé

Les deux méthodes contribuent à faciliter le partage des données de santé et à le rendre plus efficace. En offrant des solutions simples pour convertir les données de santé, elles aident les communautés de recherche à se rassembler, favorisant la collaboration et, en fin de compte, propulsant les avancées dans la médecine de précision.

Blague à part, quand il s'agit de santé, partager des données est une affaire sérieuse. Avec ces méthodes en jeu, nous sommes plus proches d'un monde où les informations de santé circulent librement, facilitant la tâche des fournisseurs de soins de santé pour offrir les meilleurs soins possibles à leurs patients. À cet avenir-et peut-être un peu de soupe à côté !

Source originale

Titre: Enhancing Semantic Interoperability in Precision Medicine: Converting OMOP CDM to Beacon v2 in the Spanish IMPaCT- Data Project

Résumé: ObjectiveTo introduce novel methods to convert OMOP CDM data into GA4GH Beacon v2 format, enhancing semantic interoperability within Spains IMPaCT-Data program for personalized medicine. Materials and MethodsWe utilized a file-based approach with the Convert-Pheno tool to transform OMOP CDM exports into Beacon v2 format. Additionally, we developed a direct connection from PostgreSQL OMOP CDM to the Beacon v2 API, enabling real-time data access without intermediary text files. ResultsWe successfully converted OMOP CDM datasets from three research centers (CNAG, IIS La Fe, and HMar) to Beacon v2 format with nearly 100% data completeness. The direct connection approach improved data freshness and adaptability for dynamic environments. Discussion and ConclusionThis study introduces two methodologies for integrating OMOP CDM data with Beacon v2, offering performance optimization or real-time access. These methodologies can be adopted by other centers to enhance interoperability and collaboration in health data sharing.

Auteurs: Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut

Dernière mise à jour: Dec 28, 2024

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606

Source PDF: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires