OpenPedCan: 小児がんの研究を進める
小児がん治療の選択肢を改善するためのデータを統合するプロジェクト。
― 1 分で読む
目次
OpenPedCanはフィラデルフィアの小児病院で進められているプロジェクトで、小児癌に関するデータを集めて分析することを目指してるんだ。目的は、いろんな情報をまとめてこれらの病気をよりよく理解し、新しい治療法の開発に役立てること。データは使いやすいプラットフォームを通じて研究者に提供されてるよ。
小児癌データの背景
小児癌は重要な健康問題で、その遺伝的・分子的な基盤を理解することが効果的な治療を作るためには不可欠なんだ。OpenPedCanプロジェクトは、異なるデータセットを統合することで進められているよ。つまり、いろんな研究から得たデータを比較できるようにして、一緒に分析できるようにして、研究のための包括的なリソースを作ってるんだ。
OpenPedCanに含まれるデータは?
OpenPedCanにはいろんな研究イニシアティブからの多様なデータタイプが含まれてる。以下はいくつかの重要なコンポーネント:
- Kids First Neuroblastoma: 一般的な小児癌である神経芽細胞腫に特化したデータセット。
- Kids First PBTA: 子供の脳腫瘍を研究する大きな取り組みの一部。
- Chordoma Foundation: 骨癌の一種であるコルドーマを理解するために集めたデータ。
- MI-ONCOSEQ Study: 腫瘍から得られる遺伝情報を生成する臨床研究。
- CPTAC PBTA: 脳腫瘍に特化した臨床プロテオミクス腫瘍分析コンソーシアムのデータ。
- CPTAC GBM: 脳癌の一種である膠芽腫に関する情報。
- HOPE Proteomics: 若い大人の高悪性度神経膠腫に関連するデータセット。
- Open Pediatric Brain Tumor Atlas: 子供のさまざまな脳腫瘍を理解するための重要なリソース。
データ収集の方法
プロジェクトは、患者から大量の遺伝的および臨床データを集めることから始まったんだ。これには、腫瘍、治療、結果に関する情報が含まれてる。データは体系的に収集されてて、信頼性があり、異なる研究間で比較可能なんだよ。
データの調和
癌研究の課題の一つは、異なる研究からのデータが一貫性がないこと。OpenPedCanは、調和化と呼ばれるプロセスでこれに対処してる。これは、データの収集と分析の方法を標準化して、研究者たちが発見を結合してより広い結論を引き出せるようにすることを含んでるんだ。
マルチオミクデータ
プロジェクトはマルチオミクデータを集めてる。これは、いろんな生物学的層からのデータを指してるんだ:
- ゲノミクス: 遺伝子とその機能の研究。
- トランスクリプトミクス: RNAと遺伝子の発現を調べること。
- プロテオミクス: タンパク質とその役割を分析すること。
- メチル化研究: 遺伝子の調節の仕組みを理解すること。
これらのいろんなタイプのデータを集めることで、プロジェクトは小児癌の全体的な様子を把握できるんだ。
使用されるツールと方法
データ分析ワークフロー
OpenPedCanは、収集したデータを分析するために特定のワークフローを利用してる。これには、大量のデータを効率的に処理できるソフトウェアツールを使うことが含まれてるんだ。
継続的インテグレーション
プロジェクトでは、継続的インテグレーションも活用されてる。これは、ソフトウェア開発の中で、定期的な更新をテストして統合することを可能にする実践で、進行中の作業を妨げずに行える。これにより、分析が再現可能で最新の状態を保つことができるんだ。
プロジェクトのコラボレーション
OpenPedCanは研究者間のコラボレーションを奨励してるよ。貢献を許可することで、プロジェクトは革新を促進するだけでなく、さまざまな視点を考慮することができるようにしてる。これは癌研究の複雑な分野で特に重要なんだ。
データアクセスと配布
OpenPedCanの成果やデータセットは、さまざまなオンラインプラットフォームを通じて利用可能にされてる。研究者はデータに簡単にアクセスできるようになってて、さらなる研究を促進し、小児癌治療の発見を加速するのに役立ってるんだ。
OpenPedCanの重要性
OpenPedCanは小児癌との戦いにおいて重要な役割を果たしてる:
- 研究者にとって包括的なリソースを提供してる。
- 異なる研究間の比較をより良くすることを可能にしてる。
- 共有された知識に基づいて新しい治療の開発を支援してる。
結論
要するに、OpenPedCanは小児癌の理解を深めることを目指した重要なイニシアティブなんだ。さまざまな情報源からデータを集めて調和させることで、プロジェクトは研究コミュニティがこれらの病気に取り組む能力を強化してる。コラボレーションの性質とデータへのオープンアクセスが、科学者たちが一緒に働き、発見を共有し、最終的には癌に直面する子供たちのケアを改善することを可能にしてるんだ。
タイトル: The Open Pediatric Cancer Project
概要: BackgroundIn 2019, the Open Pediatric Brain Tumor Atlas (OpenPBTA) was created as a global, collaborative open-science initiative to genomically characterize 1,074 pediatric brain tumors and 22 patient-derived cell lines. Here, we extend the OpenPBTA to create the Open Pediatric Cancer (OpenPedCan) Project, a harmonized open-source multi-omic dataset from 6,112 pediatric cancer patients with 7,096 tumor events across more than 100 histologies. Combined with RNA-Seq from the Genotype-Tissue Expression (GTEx) and The Cancer Genome Atlas (TCGA), OpenPedCan contains nearly 48,000 total biospecimens (24,002 tumor and 23,893 normal specimens). FindingsWe utilized Gabriella Miller Kids First (GMKF) workflows to harmonize WGS, WXS, RNA-seq, and Targeted Sequencing datasets to include somatic SNVs, InDels, CNVs, SVs, RNA expression, fusions, and splice variants. We integrated summarized CPTAC whole cell proteomics and phospho-proteomics data, miRNA-Seq data, and have developed a methylation array harmonization workflow to include m-values, beta-vales, and copy number calls. OpenPedCan contains reproducible, dockerized workflows in GitHub, CAVATICA, and Amazon Web Services (AWS) to deliver harmonized and processed data from over 60 scalable modules which can be leveraged both locally and on AWS. The processed data are released in a versioned manner and accessible through CAVATICA or AWS S3 download (from GitHub), and queryable through PedcBioPortal and the NCIs pediatric Molecular Targets Platform. Notably, we have expanded PBTA molecular subtyping to include methylation information to align with the WHO 2021 Central Nervous System Tumor classifications, allowing us to create research-grade integrated diagnoses for these tumors. ConclusionsOpenPedCan data and its reproducible analysis module framework are openly available and can be utilized and/or adapted by researchers to accelerate discovery, validation, and clinical translation.
著者: Jo Lynne Rokita, Z. Geng, E. Wafula, R. J. Corbett, Y. Zhang, R. Jin, K. S. Gaonkar, S. Shukla, K. S. Rathi, D. Hill, A. Lahiri, D. P. Miller, A. Sickler, K. Keith, C. Blackden, A. Chroni, M. A. Brown, A. A. Kraya, C. J. Koschmann, K. Aldape, X. Huang, B. R. Rood, J. L. Mason, G. R. Trooskin, Z. Abdullaev, P. Wang, Y. Zhu, B. K. Farrow, A. Farrel, J. M. Dybas, C. Zhong, N. Van Kuren, B. Zhang, M. Santi, S. Phul, A. T. Chinwalla, A. C. Resnick, S. J. Diskin, S. Tasian, S. Stefankiewicz, J. M. Maris, B. M. Ennis, M. R. Lueder, A. S. Naqvi, N. Coleman, W. Ma, D Taylor
最終更新: 2024-07-11 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.07.09.599086
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.07.09.599086.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。