Puenteando Datos de Salud: OMOP y Genómica
Descubre cómo OMOP CDM transforma el intercambio de datos de salud y la medicina de precisión.
Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut
― 7 minilectura
Tabla de contenidos
- ¿Cuál es el rollo con OMOP CDM?
- Entra la Comunidad OHDSI y Sus Héroes
- Una Iniciativa Española para la Medicina de Precisión
- Transformando Datos de OMOP CDM a Beacon v2
- El Enfoque Basado en Archivos: Cocinando de Antemano
- El Enfoque En Tiempo Real: Sin Esperar
- Probando las Aguas: Conversión de Datos en el Mundo Real
- Conversión Basada en Archivos en el CNAG
- Conversión Basada en Archivos en IIS La Fe
- Conversión Basada en Archivos en Hospital del Mar
- Una Comparación de Métodos de Cocción
- Cuándo Cocinar de Antemano
- Cuándo Pedir en Tiempo Real
- Conclusión: Una Alianza por la Salud
- Fuente original
- Enlaces de referencia
En el mundo de hoy, los datos de salud están creciendo a un ritmo impresionante, especialmente cuando se trata de información genómica y clínica. Estos datos pueden ayudar a los doctores a ofrecer tratamientos más personalizados adaptados a las necesidades de cada paciente. Sin embargo, hay un pero: compartir estos datos entre diferentes sistemas puede ser tan complicado como armar un rompecabezas con piezas faltantes. Aquí es donde entra en juego un marco llamado Modelo Común de Datos OMOP (CDM). Piénsalo como un idioma universal para datos clínicos que facilita la comunicación entre diferentes sistemas.
¿Cuál es el rollo con OMOP CDM?
El OMOP CDM tiene como objetivo organizar los datos clínicos de una manera estándar. Está ampliamente aceptado y apoyado por un grupo conocido como OHDSI. Tienen un vocabulario estandarizado que ayuda a categorizar una amplia variedad de información de salud. ¿El objetivo? Asegurarse de que, sin importar de dónde venga el dato (un hospital de investigación en España o una clínica en EE.UU.), todos hablen el mismo idioma. Imagina que las conversaciones fluyen sin pausas incómodas o malentendidos.
Pero OMOP CDM tiene un pequeño inconveniente: no maneja muy bien los datos genómicos. Y eso es un gran problema porque la información genómica es esencial para la medicina personalizada, que busca adaptar tratamientos a perfiles genéticos individuales.
Entra la Comunidad OHDSI y Sus Héroes
Para abordar esta deficiencia, la comunidad OHDSI reunió a un equipo de expertos dedicados a mejorar el OMOP CDM. Quieren asegurarse de que los datos genómicos puedan mezclarse sin problemas. Este esfuerzo es parte de una misión global más grande para mejorar el intercambio y colaboración en datos de salud, gracias a iniciativas como la Alianza Global para Genómica y Salud (GA4GH).
GA4GH introdujo algunas herramientas útiles como los estándares Beacon v2 y Phenopacket v2 para compartir datos genómicos y fenotípicos. Piénsalo como mensajes de texto estandarizados que aseguran que tus emojis no se vean raros al ser enviados desde un modelo de teléfono a otro.
Una Iniciativa Española para la Medicina de Precisión
En España, el programa IMPaCT busca tomar en serio la medicina de precisión. Busca incorporar los últimos avances en salud genómica en el Sistema Nacional de Salud, asegurando que todos tengan acceso a tratamientos de primera. Una parte de este programa se llama IMPaCT-Data, que mezcla diferentes conjuntos de datos, facilitando la búsqueda del dato genómico y fenotípico adecuado.
Transformando Datos de OMOP CDM a Beacon v2
Entonces, ¿cómo transformamos los datos de OMOP CDM para que coincidan con el formato Beacon v2? Bueno, este artículo revela dos enfoques principales: un método basado en archivos y un método en tiempo real. Uno de ellos es como preparar un guiso abundante con anticipación, mientras que el otro es cocinar una comida fresca justo cuando tienes hambre.
El Enfoque Basado en Archivos: Cocinando de Antemano
El método de conversión basado en archivos trabaja de manera bastante eficiente para centros que usan bases de datos no relacionales, como MongoDB. Aquí, grandes volúmenes de datos de pacientes se pretransforman en un formato amigable para Beacon, haciendo que el acceso sea rápido y sencillo. Imagina a un chef picando todos los ingredientes para una comida deliciosa la noche anterior. Este método es genial cuando los investigadores necesitan acceder a datos rápidamente, pero requiere algunas actualizaciones periódicas para mantener todo fresco.
Para que este proceso arranque, se exportan datos de una base de datos relacional y se convierten a formato JSON. Una vez convertidos, estos datos pueden ser almacenados ordenadamente en una base de datos no relacional, donde se puede acceder a través de la API Beacon v2. ¡Como tener tu sopa lista para cuando quieras una comida rápida!
El Enfoque En Tiempo Real: Sin Esperar
Por otro lado, el método en tiempo real toma una ruta más dinámica. En lugar de preparar datos con anticipación, se conecta directamente a la base de datos de OMOP CDM cuando alguien necesita acceder a información. Piensa en esto como un camión de comida preparando platos gourmet justo frente a ti.
Cada vez que llega una solicitud, el sistema traduce esas solicitudes en consultas SQL para recuperar la información requerida de la base de datos. Este enfoque es excelente para situaciones que requieren la información más actual, como cuando nuevos datos de pacientes están llegando a diario. Sin embargo, requiere que la base de datos esté bien organizada para funcionar sin problemas. Es un balance de velocidad y eficiencia adaptado para acceso en tiempo real.
Probando las Aguas: Conversión de Datos en el Mundo Real
Para ver qué tan bien funcionan estos métodos en el mundo real, realizaron pruebas usando varias fuentes de datos de salud en España. Usaron conjuntos de datos de cosas como registros de pacientes con COVID-19 para entender la efectividad de sus procedimientos de conversión.
Conversión Basada en Archivos en el CNAG
Por ejemplo, en el Centro Nacional de Análisis Genómico (CNAG), usaron el conjunto de datos EUNOMIA, que contiene registros de miles de pacientes. Al transformar estos datos al formato Beacon v2, pudieron obtener una imagen clara de la salud del paciente y compartir esta información con otros investigadores.
Conversión Basada en Archivos en IIS La Fe
Luego, probaron el método basado en archivos en el Instituto de Investigación Sanitaria Hospital La Fe. Aquí, juntaron información clínica de pacientes con COVID-19. El objetivo era convertir estos datos al formato Beacon v2, permitiendo a los investigadores consultar características de salud específicas fácilmente. Y, como hornear galletas, ¡los resultados finales fueron deliciosamente completos con información!
Conversión Basada en Archivos en Hospital del Mar
En el Hospital del Mar, accedieron a una base de datos masiva que tiene información sobre alrededor de un millón de pacientes. Usando la base de datos IMASIS, lograron convertir datos al formato Beacon v2 manteniendo casi una precisión perfecta. ¡Es asombroso cuánto conocimiento se puede obtener de una colección de datos tan grande!
Una Comparación de Métodos de Cocción
El estudio también examina los pros y los contras de ambos métodos de conversión.
Cuándo Cocinar de Antemano
El enfoque basado en archivos es mejor para centros que valoran el acceso a datos preformateados. Es particularmente adecuado para proyectos que combinan información de múltiples fuentes. Una gran ventaja aquí es el rápido tiempo de respuesta, lo que lo hace perfecto cuando los investigadores están listos para profundizar en sus datos.
Cuándo Pedir en Tiempo Real
La conversión en tiempo real brilla cuando tener la información más actual es crítico. Previene la necesidad de actualizaciones periódicas y evita las complicaciones de mantener datos duplicados. Sin embargo, depende de tener una base de datos rápida y bien organizada para que funcione mejor.
Conclusión: Una Alianza por la Salud
Ambos métodos contribuyen a facilitar y hacer más eficiente el intercambio de datos de salud. Al ofrecer soluciones simples para convertir datos de salud, ayudan a que las comunidades de investigación se unan, fomentando la colaboración y, en última instancia, impulsando avances en la medicina de precisión.
Bromas aparte, cuando se trata de salud, compartir datos es un asunto serio. Con estos métodos en juego, estamos más cerca de un mundo donde la información de salud fluye libremente, facilitando que los proveedores de atención médica ofrezcan la mejor atención posible a sus pacientes. ¡Brindemos por ese futuro—y tal vez un poco de sopa al lado!
Fuente original
Título: Enhancing Semantic Interoperability in Precision Medicine: Converting OMOP CDM to Beacon v2 in the Spanish IMPaCT- Data Project
Resumen: ObjectiveTo introduce novel methods to convert OMOP CDM data into GA4GH Beacon v2 format, enhancing semantic interoperability within Spains IMPaCT-Data program for personalized medicine. Materials and MethodsWe utilized a file-based approach with the Convert-Pheno tool to transform OMOP CDM exports into Beacon v2 format. Additionally, we developed a direct connection from PostgreSQL OMOP CDM to the Beacon v2 API, enabling real-time data access without intermediary text files. ResultsWe successfully converted OMOP CDM datasets from three research centers (CNAG, IIS La Fe, and HMar) to Beacon v2 format with nearly 100% data completeness. The direct connection approach improved data freshness and adaptability for dynamic environments. Discussion and ConclusionThis study introduces two methodologies for integrating OMOP CDM data with Beacon v2, offering performance optimization or real-time access. These methodologies can be adopted by other centers to enhance interoperability and collaboration in health data sharing.
Autores: Manuel Rueda, Juan Manuel Ramírez-Anguita, Victoria López-Sánchez, Sergi Aguiló-Castillo, Maria Eugenia Gas López, Alberto Labarga, Miguel-Ángel Mayer, Javier Ripoll Esteve, Ivo G. Gut
Última actualización: 2024-12-28 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606
Fuente PDF: https://www.medrxiv.org/content/10.1101/2024.12.25.24319606.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://github.com/OHDSI/Genomic-CDM
- https://impact.isciii.es/
- https://impact-data.bsc.es/en/about/impact
- https://3tr-imi.eu/
- https://github.com/CNAG-Biomedical-Informatics/omop-cdm-2-beacon-v2
- https://gitlab.bsc.es/impact-data/impd-beacon_omopcdm
- https://ohdsi.github.io/Eunomia/
- https://www.sjdhospitalbarcelona.org/es/hospital/proyectos-estrategicos/red-unicas-atencion-enfermedades-minoritarias
- https://by-covid.org/
- https://www.gcatbiobank.org/