BrST-Net: 乳がん研究の新しい時代
BrST-Netは、標準の組織サンプルを使って乳がんの遺伝子活性を予測する。
― 1 分で読む
乳がんは女性に多い病気で、いろんな形があります。2018年には、何百万もの女性が乳がんと診断され、多くの人が命を失いました。早期に乳がんが見つかれば患者には希望があり、ほとんどの人が最初の5年を生き延びる可能性があります。ただ、病気が進行すると、現行の医療方法で治療が難しくなることがあります。だから、早くがんを見つけて、治療結果を改善する方法を見つけることが大事です。
乳がんの診断と治療の重要な部分は、腫瘍からの組織サンプルを調べることです。医者は顕微鏡でこれらのサンプルを見て、がんの種類やステージを特定します。ただ、これらのサンプルは遺伝子の活動に大きな違いがあることが多く、患者が治療にどれくらい反応するかを予測するのが難しいです。
新しい技術
「空間トランスクリプトミクス」という新しい技術は、研究者がより詳細に遺伝子の活動を研究するのを助けます。この技術を使うことで、科学者は組織の異なる部分で遺伝子がどのように表現されているかを見ることができ、腫瘍で何が起こっているのかがより明確になります。ただ、この技術はしばしば高価なので、多くの患者を含む大規模な研究で使うのが難しいです。
その一方で、ヘマトキシリン・エオシン(H&E)などの染色を使った従来の組織サンプルの検査方法は安くて広く利用可能です。これらの染色画像は毎日病院で使われているので、新しい技術の高いコストなしで遺伝子の活動を研究するための理想的な選択肢です。
BrST-Netフレームワーク
既存の組織サンプルを活用するために、「BrST-Net」という新しい方法が作られました。この方法は、H&E染色サンプルの画像を使って乳がんの遺伝子活動を予測します。このフレームワークは、データから学び予測を行う深層学習モデルと呼ばれる先進的なコンピュータプログラムを使っています。
BrST-Netは、乳がんサンプルの画像を分析し、特定の遺伝子の発現レベルを予測するように設計されています。これには、何千もの画像を取り、モデルをトレーニングし、これらのモデルがどれだけ遺伝子活動を予測できるかを評価することが含まれます。こうすることで、このフレームワークは乳がんにおける遺伝子発現パターンを理解するためのコストパフォーマンスの高い方法を提供しようとしています。
使用データ
BrST-Netをテストするために、研究者は乳がん患者からの画像コレクションを使用しました。これらの画像はさまざまな種類の乳がんから来ていて、幅広いサンプルを提供しました。それぞれの画像は非常に詳細で、遺伝子活動が測定された何千ものスポットが含まれています。
モデルに画像を入力する前に、研究者はデータを準備する必要がありました。画像の色を正規化して結果が一貫性を持つようにし、予測に干渉する可能性のある無関係なデータを除去しました。
モデルのトレーニング
BrST-Netは、画像データを解釈するためにいくつかのタイプの先進的なモデルを使用します。研究者は、画像分析のための特定の設計を含む異なるコンピュータモデルをトレーニングしました。どのモデルが遺伝子活動レベルの予測に最も優れているかを見極めようとしました。モデルは、数多くの例を調べることで画像のパターンを特定することを学びました。
プロセスの重要な部分は、モデルがデータを単に記憶するだけでなく、学んだことから一般化できるようにすることでした。これを達成するために、予測を改善するために主モデルに補助ネットワークを追加しました。この補助ネットワークにより、トレーニング中に追加の支援を提供することで、システムがより信頼できる予測を行えるようになりました。
結果
モデルのトレーニングが終わった後、研究者たちはBrST-Netが従来の方法を上回っていることを発見しました。この新しいフレームワークは、以前のアプローチよりも多くの遺伝子を正の相関で予測することができました。BrST-Netは合計で237の遺伝子を特定でき、以前のシステムが報告した102の遺伝子を大きく上回りました。
研究者たちは、いくつかの遺伝子が予測された発現レベルと実際の発現レベルとの間に強い相関があることにも注目しました。これらの発見は、新しいシステムががん生物学を理解し、患者ケアを改善するための実世界での応用の可能性を示していました。
予測の可視化
BrST-Netがどれだけうまく機能したかを理解するために、研究者は予測された遺伝子発現を組織サンプルの実際の画像と比較しました。この比較から、予測ががん細胞を含む組織の領域とよく一致していることが分かりました。こうした可視化は、モデルの精度を確認するだけでなく、がん組織内で特定の遺伝子がどのように振る舞うかを理解しようとする医者や研究者にとっても貴重な洞察を提供します。
計算コスト
BrST-Netシステムのトレーニングにはかなりの計算リソースが必要でしたが、一度モデルが構築されると、それを迅速に適用できます。実際には、トレーニングには数時間かかりますが、新しい画像にモデルを適用するのには数秒しかかからず、臨床現場での使用には実用的です。
今後の研究
BrST-Netで得られた成功した結果にもかかわらず、改善の余地はまだあります。多くの機械学習の方法と同様に、大きなデータセットはより良いパフォーマンスにつながります。さらなる研究では、より多くの組織サンプルを収集したり、複数の研究の結果を組み合わせたりして、予測の精度と信頼性を向上させることが考えられます。
また、研究者たちは、異なるモデルタイプを組み合わせて、より洗練された遺伝子発現予測のアプローチを作る可能性を探ることができるでしょう。モデルを継続的に洗練させ、新しいデータを取り入れることで、BrST-Netは乳がんを理解し、治療戦略をガイドするためのさらに強力なツールとなるでしょう。
結論
BrST-Netは、既存の組織サンプルを使って乳がんの遺伝子発現レベルを予測するための重要な進展を表しています。このフレームワークは、がんでの遺伝子の振る舞いを理解するだけでなく、臨床応用における大規模データセットを分析するための実用的でコスト効果の高い解決策を提供します。さらなる研究と開発によって、BrST-Netはがん診断と治療の改善に重要な役割を果たし、最終的には多くの患者の乳がんとの闘いに役立つことができるでしょう。
タイトル: Breast Cancer Histopathology Image based Gene Expression Prediction using Spatial Transcriptomics data and Deep Learning
概要: Tumour heterogeneity in breast cancer poses challenges in predicting outcome and response to therapy. Spatial transcriptomics technologies may address these challenges, as they provide a wealth of information about gene expression at the cell level, but they are expensive, hindering their use in large-scale clinical oncology studies. Predicting gene expression from hematoxylin and eosin stained histology images provides a more affordable alternative for such studies. Here we present BrST-Net, a deep learning framework for predicting gene expression from histopathology images using spatial transcriptomics data. Using this framework, we trained and evaluated 10 state-of-the-art deep learning models without utilizing pretrained weights for the prediction of 250 genes. To enhance the generalisation performance of the main network, we introduce an auxiliary network into the framework. Our methodology outperforms previous studies, with 237 genes identified with positive correlation, including 24 genes with a median correlation coefficient greater than 0.50. This is a notable improvement over previous studies, which could predict only 102 genes with positive correlation, with the highest correlation values ranging from 0.29 to 0.34.
著者: Md Mamunur Rahaman, Ewan K. A. Millar, Erik Meijering
最終更新: 2023-03-17 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2303.09987
ソースPDF: https://arxiv.org/pdf/2303.09987
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。