OpenPedCan: Forschung zu pädiatrischem Krebs voranbringen
Ein Projekt, das Daten zusammenbringt, um die Behandlungsmöglichkeiten für Kinder mit Krebs zu verbessern.
― 4 min Lesedauer
Inhaltsverzeichnis
- Hintergrund zu pädiatrischen Krebsdaten
- Welche Daten sind in OpenPedCan enthalten?
- Wie werden die Daten gesammelt?
- Datenharmonisierung
- Multi-Omic Daten
- Werkzeuge und Methoden
- Datenanalyse-Workflows
- Kontinuierliche Integration
- Projektzusammenarbeit
- Datenzugang und -verbreitung
- Bedeutung von OpenPedCan
- Fazit
- Originalquelle
- Referenz Links
OpenPedCan ist ein Projekt im Kinderkrankenhaus von Philadelphia, das Daten zu pädiatrischen Krebserkrankungen sammelt und analysiert. Das Ziel ist, Informationen aus verschiedenen Quellen zusammenzubringen, um diese Krankheiten besser zu verstehen und neue Behandlungsoptionen zu entwickeln. Die Daten werden Forschern über benutzerfreundliche Plattformen zur Verfügung gestellt.
Hintergrund zu pädiatrischen Krebsdaten
Pädiatrischer Krebs ist ein grosses Gesundheitsproblem, und das Verständnis seiner genetischen und molekularen Grundlagen ist entscheidend, um effektive Behandlungen zu entwickeln. Das OpenPedCan-Projekt harmonisiert unterschiedliche Datensätze, also sie nehmen Daten aus verschiedenen Studien und sorgen dafür, dass man sie vergleichen und zusammen analysieren kann, um eine umfassendere Ressource für die Forschung zu schaffen.
Welche Daten sind in OpenPedCan enthalten?
OpenPedCan umfasst eine vielfältige Datenmenge aus mehreren Forschungsinitiativen. Hier sind einige wichtige Bestandteile:
- Kids First Neuroblastoma: Ein Datensatz, der sich auf Neuroblastom, eine häufige Krebsart bei Kindern, konzentriert.
- Kids First PBTA: Teil einer grösseren Anstrengung, um Gehirntumoren bei Kindern zu studieren.
- Chordoma Foundation: Daten, die gesammelt wurden, um Chordome, eine Art von Knochenkrebs, zu verstehen.
- MI-ONCOSEQ-Studie: Eine klinische Studie, die genetische Informationen aus Tumoren generiert.
- CPTAC PBTA: Daten vom Clinical Proteomic Tumor Analysis Consortium, die sich auf Gehirntumoren konzentrieren.
- CPTAC GBM: Informationen über Glioblastom, eine Art von Gehirnkrebs.
- HOPE Proteomics: Ein Datensatz zu hochgradigen Gliomen bei jungen Erwachsenen.
- Open Pediatric Brain Tumor Atlas: Eine wichtige Ressource, um verschiedene Gehirntumoren bei Kindern zu verstehen.
Wie werden die Daten gesammelt?
Das Projekt begann damit, eine grosse Menge an genetischen und klinischen Daten von Patienten zu sammeln. Dazu gehören Informationen über die Tumoren, Behandlungen und Ergebnisse. Die Daten werden systematisch erfasst, um sicherzustellen, dass sie zuverlässig sind und über verschiedene Studien hinweg verglichen werden können.
Datenharmonisierung
Eine der Herausforderungen in der Krebsforschung ist, dass Daten aus verschiedenen Studien inkonsistent sein können. OpenPedCan geht dies mit einem Prozess namens Harmonisierung an. Das bedeutet, dass sie die Art und Weise standardisieren, wie Daten gesammelt und analysiert werden, damit Forscher ihre Ergebnisse kombinieren und umfassendere Schlussfolgerungen ziehen können.
Multi-Omic Daten
Das Projekt sammelt, was als Multi-Omic Daten bekannt ist. Das bezieht sich auf Daten aus verschiedenen biologischen Schichten, wie:
- Genomik: Das Studium von Genen und deren Funktionen.
- Transkriptomik: Die Untersuchung von RNA und wie Gene exprimiert werden.
- Proteomik: Die Analyse von Proteinen und deren Rollen.
- Methylierungsstudien: Das Verständnis, wie Gene reguliert werden.
Durch das Sammeln all dieser verschiedenen Datentypen erhält das Projekt ein umfassenderes Bild von pädiatrischem Krebs.
Werkzeuge und Methoden
Datenanalyse-Workflows
OpenPedCan nutzt spezifische Workflows, um die gesammelten Daten zu analysieren. Dabei kommen Software-Tools zum Einsatz, die grosse Datenmengen effizient verarbeiten können.
Kontinuierliche Integration
Das Projekt nutzt auch kontinuierliche Integration, eine Praxis in der Softwareentwicklung, die regelmässige Updates ermöglicht, ohne dass die laufende Arbeit gestört wird. Das sorgt dafür, dass die Analysen reproduzierbar und aktuell bleiben.
Projektzusammenarbeit
OpenPedCan fördert die Zusammenarbeit unter Forschern. Durch die Ermöglichung von Beiträgen sorgt das Projekt nicht nur für Innovation, sondern stellt auch sicher, dass verschiedene Perspektiven berücksichtigt werden. Das ist entscheidend im komplexen Bereich der Krebsforschung.
Datenzugang und -verbreitung
Die Ergebnisse und Datensätze von OpenPedCan sind über verschiedene Online-Plattformen zugänglich. Forscher können die Daten leicht abrufen, was weitere Studien fördert und die Entdeckungen in der Behandlung von pädiatrischem Krebs beschleunigt.
Bedeutung von OpenPedCan
OpenPedCan spielt eine entscheidende Rolle im Kampf gegen pädiatrische Krebserkrankungen, indem es:
- Eine umfassende Ressource für Forscher bereitstellt.
- Bessere Vergleiche zwischen verschiedenen Studien ermöglicht.
- Die Entwicklung neuer Behandlungen auf Grundlage geteilter Erkenntnisse unterstützt.
Fazit
Zusammenfassend ist OpenPedCan eine wichtige Initiative, die darauf abzielt, unser Verständnis von pädiatrischem Krebs zu verbessern. Durch das Sammeln und Harmonisieren von Daten aus verschiedenen Quellen stärkt das Projekt die Fähigkeit der Forschungsgemeinschaft, sich mit diesen Krankheiten auseinanderzusetzen. Die kollaborative Natur und der offene Zugang zu Daten ermöglichen es Wissenschaftlern, zusammenzuarbeiten, Ergebnisse zu teilen und letztendlich die Versorgung von Kindern mit Krebs zu verbessern.
Titel: The Open Pediatric Cancer Project
Zusammenfassung: BackgroundIn 2019, the Open Pediatric Brain Tumor Atlas (OpenPBTA) was created as a global, collaborative open-science initiative to genomically characterize 1,074 pediatric brain tumors and 22 patient-derived cell lines. Here, we extend the OpenPBTA to create the Open Pediatric Cancer (OpenPedCan) Project, a harmonized open-source multi-omic dataset from 6,112 pediatric cancer patients with 7,096 tumor events across more than 100 histologies. Combined with RNA-Seq from the Genotype-Tissue Expression (GTEx) and The Cancer Genome Atlas (TCGA), OpenPedCan contains nearly 48,000 total biospecimens (24,002 tumor and 23,893 normal specimens). FindingsWe utilized Gabriella Miller Kids First (GMKF) workflows to harmonize WGS, WXS, RNA-seq, and Targeted Sequencing datasets to include somatic SNVs, InDels, CNVs, SVs, RNA expression, fusions, and splice variants. We integrated summarized CPTAC whole cell proteomics and phospho-proteomics data, miRNA-Seq data, and have developed a methylation array harmonization workflow to include m-values, beta-vales, and copy number calls. OpenPedCan contains reproducible, dockerized workflows in GitHub, CAVATICA, and Amazon Web Services (AWS) to deliver harmonized and processed data from over 60 scalable modules which can be leveraged both locally and on AWS. The processed data are released in a versioned manner and accessible through CAVATICA or AWS S3 download (from GitHub), and queryable through PedcBioPortal and the NCIs pediatric Molecular Targets Platform. Notably, we have expanded PBTA molecular subtyping to include methylation information to align with the WHO 2021 Central Nervous System Tumor classifications, allowing us to create research-grade integrated diagnoses for these tumors. ConclusionsOpenPedCan data and its reproducible analysis module framework are openly available and can be utilized and/or adapted by researchers to accelerate discovery, validation, and clinical translation.
Autoren: Jo Lynne Rokita, Z. Geng, E. Wafula, R. J. Corbett, Y. Zhang, R. Jin, K. S. Gaonkar, S. Shukla, K. S. Rathi, D. Hill, A. Lahiri, D. P. Miller, A. Sickler, K. Keith, C. Blackden, A. Chroni, M. A. Brown, A. A. Kraya, C. J. Koschmann, K. Aldape, X. Huang, B. R. Rood, J. L. Mason, G. R. Trooskin, Z. Abdullaev, P. Wang, Y. Zhu, B. K. Farrow, A. Farrel, J. M. Dybas, C. Zhong, N. Van Kuren, B. Zhang, M. Santi, S. Phul, A. T. Chinwalla, A. C. Resnick, S. J. Diskin, S. Tasian, S. Stefankiewicz, J. M. Maris, B. M. Ennis, M. R. Lueder, A. S. Naqvi, N. Coleman, W. Ma, D Taylor
Letzte Aktualisierung: 2024-07-11 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.07.09.599086
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.07.09.599086.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.