Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Genómica

OpenPedCan: Avanzando en la Investigación del Cáncer Pediátrico

Un proyecto que une datos para mejorar las opciones de tratamiento del cáncer pediátrico.

― 5 minilectura


OpenPedCan: Iniciativa deOpenPedCan: Iniciativa deDatos sobre el CáncerPediátricoinfantiles.tratamientos de los cánceresRecopilando datos para mejorar los
Tabla de contenidos

OpenPedCan es un proyecto en el Hospital de Niños de Filadelfia que busca recolectar y analizar datos relacionados con el cáncer pediátrico. La meta es juntar info de varias fuentes para entender mejor estas enfermedades y ayudar a desarrollar nuevas opciones de tratamiento. Los datos están disponibles para los investigadores a través de plataformas fáciles de usar.

Antecedentes sobre los Datos de Cáncer Pediátrico

El cáncer pediátrico es un problema de salud importante, y entender su base genética y molecular es clave para crear tratamientos efectivos. El proyecto OpenPedCan trabaja armonizando diferentes conjuntos de datos. Esto significa que toman datos de varios estudios y se aseguran de que se puedan comparar y analizar juntos, creando un recurso más completo para la investigación.

¿Qué Datos Incluye OpenPedCan?

OpenPedCan incluye un conjunto diverso de tipos de datos de varias iniciativas de investigación. Aquí van algunos componentes clave:

  1. Kids First Neuroblastoma: Un conjunto de datos centrado en el neuroblastoma, un cáncer común en la infancia.
  2. Kids First PBTA: Parte de un esfuerzo mayor para estudiar tumores cerebrales en niños.
  3. Chordoma Foundation: Datos recopilados para entender el cordoma, un tipo de cáncer óseo.
  4. MI-ONCOSEQ Study: Un estudio clínico que genera información genética de tumores.
  5. CPTAC PBTA: Datos del Consorcio de Análisis Tumoral Proteómico Clínico centrados en tumores cerebrales.
  6. CPTAC GBM: Información sobre glioblastoma, un tipo de cáncer cerebral.
  7. HOPE Proteomics: Un conjunto de datos relacionado con gliomas de alto grado en adultos jóvenes.
  8. Open Pediatric Brain Tumor Atlas: Un recurso significativo para entender varios tumores cerebrales en niños.

Cómo se Recopilan los Datos

El proyecto comenzó recolectando un gran volumen de datos genéticos y clínicos de pacientes. Esto incluye info sobre los tumores, tratamientos y resultados. Los datos se recogen de manera sistemática, asegurando que sean confiables y se puedan comparar entre diferentes estudios.

Armonización de Datos

Uno de los desafíos en la investigación sobre cáncer es que los datos de diferentes estudios pueden ser inconsistentes. OpenPedCan aborda esto a través de un proceso llamado armonización. Esto implica estandarizar la forma en que se recopilan y analizan los datos para que los investigadores puedan combinar sus hallazgos y sacar conclusiones más amplias.

Datos multi-ómicos

El proyecto recolecta lo que se conoce como datos multi-ómicos. Esto se refiere a datos de varias capas biológicas, como:

  • Genómica: El estudio de los genes y sus funciones.
  • Transcriptómica: Mirando el ARN y cómo se expresan los genes.
  • Proteómica: Analizando proteínas y sus roles.
  • Estudios de Metilación: Entendiendo cómo se regulan los genes.

Al recopilar todos estos diferentes tipos de datos, el proyecto obtiene una imagen más completa de los cánceres pediátricos.

Herramientas y Métodos Usados

Flujos de Trabajo de Análisis de Datos

OpenPedCan usa flujos de trabajo específicos para analizar los datos recolectados. Esto implica usar herramientas de software que pueden procesar grandes cantidades de datos de manera eficiente.

Integración Continua

El proyecto también utiliza integración continua, que es una práctica en el desarrollo de software que permite que las actualizaciones regulares se prueben e integren sin interrumpir el trabajo en curso. Esto asegura que el análisis se mantenga reproducible y actualizado.

Colaboración del Proyecto

OpenPedCan fomenta la colaboración entre investigadores. Al permitir contribuciones, el proyecto no solo impulsa la innovación, sino que también asegura que se tengan en cuenta diversos puntos de vista. Esto es crucial en el complejo campo de la investigación del cáncer.

Acceso y Distribución de Datos

Los hallazgos y conjuntos de datos de OpenPedCan se ponen a disposición a través de varias plataformas en línea. Los investigadores pueden acceder fácilmente a los datos, lo que promueve estudios adicionales y ayuda a acelerar los descubrimientos en tratamientos para el cáncer pediátrico.

Importancia de OpenPedCan

OpenPedCan juega un rol crucial en la lucha contra los cánceres pediátricos al:

  • Proveer un recurso completo para los investigadores.
  • Permitir mejores comparaciones entre diferentes estudios.
  • Apoyar el desarrollo de nuevos tratamientos basados en el conocimiento compartido.

Conclusión

En resumen, OpenPedCan es una iniciativa importante que busca mejorar nuestra comprensión de los cánceres pediátricos. Al recopilar y armonizar datos de diversas fuentes, el proyecto fortalece la capacidad de la comunidad investigadora para abordar estas enfermedades. La naturaleza colaborativa y el acceso abierto a los datos permiten que los científicos trabajen juntos, compartan hallazgos y, en última instancia, mejoren la atención para los niños que enfrentan el cáncer.

Fuente original

Título: The Open Pediatric Cancer Project

Resumen: BackgroundIn 2019, the Open Pediatric Brain Tumor Atlas (OpenPBTA) was created as a global, collaborative open-science initiative to genomically characterize 1,074 pediatric brain tumors and 22 patient-derived cell lines. Here, we extend the OpenPBTA to create the Open Pediatric Cancer (OpenPedCan) Project, a harmonized open-source multi-omic dataset from 6,112 pediatric cancer patients with 7,096 tumor events across more than 100 histologies. Combined with RNA-Seq from the Genotype-Tissue Expression (GTEx) and The Cancer Genome Atlas (TCGA), OpenPedCan contains nearly 48,000 total biospecimens (24,002 tumor and 23,893 normal specimens). FindingsWe utilized Gabriella Miller Kids First (GMKF) workflows to harmonize WGS, WXS, RNA-seq, and Targeted Sequencing datasets to include somatic SNVs, InDels, CNVs, SVs, RNA expression, fusions, and splice variants. We integrated summarized CPTAC whole cell proteomics and phospho-proteomics data, miRNA-Seq data, and have developed a methylation array harmonization workflow to include m-values, beta-vales, and copy number calls. OpenPedCan contains reproducible, dockerized workflows in GitHub, CAVATICA, and Amazon Web Services (AWS) to deliver harmonized and processed data from over 60 scalable modules which can be leveraged both locally and on AWS. The processed data are released in a versioned manner and accessible through CAVATICA or AWS S3 download (from GitHub), and queryable through PedcBioPortal and the NCIs pediatric Molecular Targets Platform. Notably, we have expanded PBTA molecular subtyping to include methylation information to align with the WHO 2021 Central Nervous System Tumor classifications, allowing us to create research-grade integrated diagnoses for these tumors. ConclusionsOpenPedCan data and its reproducible analysis module framework are openly available and can be utilized and/or adapted by researchers to accelerate discovery, validation, and clinical translation.

Autores: Jo Lynne Rokita, Z. Geng, E. Wafula, R. J. Corbett, Y. Zhang, R. Jin, K. S. Gaonkar, S. Shukla, K. S. Rathi, D. Hill, A. Lahiri, D. P. Miller, A. Sickler, K. Keith, C. Blackden, A. Chroni, M. A. Brown, A. A. Kraya, C. J. Koschmann, K. Aldape, X. Huang, B. R. Rood, J. L. Mason, G. R. Trooskin, Z. Abdullaev, P. Wang, Y. Zhu, B. K. Farrow, A. Farrel, J. M. Dybas, C. Zhong, N. Van Kuren, B. Zhang, M. Santi, S. Phul, A. T. Chinwalla, A. C. Resnick, S. J. Diskin, S. Tasian, S. Stefankiewicz, J. M. Maris, B. M. Ennis, M. R. Lueder, A. S. Naqvi, N. Coleman, W. Ma, D Taylor

Última actualización: 2024-07-11 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.07.09.599086

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.07.09.599086.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares