Simple Science

最先端の科学をわかりやすく解説

# 生物学# 病理学

全スライド画像解析の進展

新しい方法がタイル抽出を改善して、病気の診断がより良くなる。

― 1 分で読む


病理における強化タイル抽出病理における強化タイル抽出させる。新しい手法がデジタル病理分析の精度を向上
目次

ホールスライドイメージング(WSI)は、組織サンプルをスキャンして詳細なデジタル画像に変換する技術だよ。この方法は、医者が組織サンプルを評価して病気、特に癌を特定するのに欠かせないんだ。デジタル画像は非常に高解像度で、コンピュータで簡単に保存、共有、分析できるんだ。この技術は医療ラボで必須になってきて、遠隔診断や教育目的でも人気が高まってるよ。

WSIはすごく大きくて、40倍の高倍率で見ると100,000 × 100,000ピクセルに達することもあるんだ。もっと多くの病院やラボがこの技術を導入するにつれて、これらの巨大な画像を分析する効果的な方法の需要が高まってるよ。

画像分析における深層学習の役割

深層学習は、画像を分析するのに大きな進展を遂げた人工知能の一種だよ。これは、以前のアプローチでは効果が薄かった画像のパターンを認識する技術を応用してるの。WSIの文脈では、深層学習は組織タイプのセグメンテーション、変異の予測、スライドの分類など、さまざまな分野で役立つんだ。

人工ニューラルネットワーク(ANN)や畳み込みニューラルネットワーク(CNN)は、これらのタスクに使われる深層学習モデルの一種だよ。これらはラベル付きデータから学習するから、特長が識別された例が必要なんだ。でも、これらのラベル付き例を作るのは、データの多様性やサイズのせいで難しいこともあるよ。

WSIのサイズを管理するのは問題だよ。なぜなら、一度にすべてを処理するには大きすぎることがあるからね。だから、画像を小さなセクションやタイルに分けるのが一般的な解決策なんだ。タイルのサイズは異なることもあるけど、ほとんどの方法では256 × 256ピクセルくらいのタイルを使ってるよ。画像の小さな部分を分析することで、深層学習モデルは全体のスライドについて予測を立てることができるんだ。

ホールスライドイメージングのタイル戦略

グリッドタイルは、WSIを分解する最も一般的な方法の一つだよ。この方法は、スライドをグリッドで配置された一連の重ならないタイルに分けるんだ。HistolabやSliDLなど、WSIからタイルを効果的に抽出するのに役立つツールがいろいろあるよ。

でも、伝統的なタイル方法は、腫瘍みたいな不規則な形の領域で苦労することがあるんだ。腫瘍の部分はグリッドタイルにはうまく収まらないことが多く、関連する画像データをキャッチするのが難しいんだ。研究者たちは、注釈が付けられた領域の周りからタイルを抽出する方法でこの問題を解決しようとしてるけど、まだ画像の重要な部分を見逃すことがあるよ。

タイル抽出の課題

現在のWSIからタイルを抽出する方法は、特に腫瘍を扱うときに問題が発生することが多いんだ。腫瘍は不規則な形やサイズを持っていて、グリッドタイル方法にうまくフィットしないことがあるから、重要なエリアが抜け落ちてしまうことがあって、機械学習モデルのパフォーマンスに影響を与えることもあるよ。

たとえば、8点法を使ってタイルを選ぶと、注釈の境界内に部分的にだけあるタイルを見逃すことがあるんだ。時々、小さなタイルを抽出すると助かるかもしれないけど、それもいつもはうまくいかないことがあるよ。無意味な組織が含まれている空白のエリアや、役に立たないエリアの問題もあって、機械学習モデルのトレーニング中に混乱を招くことがあるんだ。

不要なタイルは、無関係な情報をもたらすことがあって、画像分析用に設計されたアルゴリズムのパフォーマンスを悪化させる可能性があるんだ。

タイル抽出の新しいアプローチ

これらの課題に対処するために、タイルを選択するルールを定義する新しい方法が提案されているよ。2つの概念が導入されたんだ:インターセクションオーバータイル(IoT)とバックグラウンドオーバータイル(BoT)だよ。

IoTは、タイルが注釈領域とどれくらい重なっているかを見るんだ。これによって、分析に含めるべきタイルかどうかを判断できるんだ。興味のある領域と良い重なりがあるタイルは、トレーニングに役立つ可能性が高いんだ。

BoTは、過剰な空白スペースを含むタイルを特定することに焦点を当ててるよ。空白の領域が多すぎるタイルや、情報が含まれていないタイルはデータセットから除外できるんだ。これによって、分析中に関連する組織だけを考慮することができるんだ。IoTとBoTは、どのタイルを保持して、どのタイルを捨てるかを選ぶ基準を提供するんだ。

新しい方法の実装

新しいアプローチは、PathEXというタイル抽出アルゴリズムに組み合わせることができるんだ。このアルゴリズムはIoTとBoTの両方を利用して、注釈領域の周りのタイルを抽出するのを改善し、主に背景のタイルを除外するんだ。

PathEXを使うと、研究者はIoTとBoTの閾値を調整して、特定の研究に最適な設定を見つけることができるんだ。この柔軟性によって、最も関連性の高いタイルが分析用に選ばれるようにデータセットの微調整ができるんだ。

テストと評価

テストでは、PathEXアルゴリズムがさまざまなデータセットに適用され、その効果を評価したんだ。リンパ節サンプルに焦点を当てたデータと、複数の臓器癌に関するデータの2セットを使用したよ。このデータセットから、アルゴリズムを使って特定の基準に従ってタイルを抽出したんだ。

最初の結果では、IoTとBoTの最適な閾値がモデルのパフォーマンスを改善することが示されたんだ。高い閾値はノイズタイルの数を減らして、モデルがクリーンなデータでトレーニングされるのを助けたんだ。これによって、特に重要な医療判断を行う際の分析がより正確で信頼できるものになるんだ。

結果と発見

研究では、IoTの値を0.2から0.5の間に設定し、BoT設定を0.2くらいにすると最良の結果が得られたんだ。高い閾値はノイズを減らすけど、モデルがトレーニングデータにはうまく動作するけど新しいデータにはあまりうまくいかないオーバーフィッティングを引き起こすこともあるんだ。

結果は、ある程度のノイズタイルを残すことが実際にはモデルの堅牢性を高めるのを助ける可能性があることを示唆してるよ。なぜなら、より多様な例を持つことで、モデルがパターンを認識するのをより効果的に学ぶのを助けられるんだ。

空白部分だけのタイルを排除することで、データセットの全体的な質が向上したことから、深層学習モデル用のデータを準備する際にはIoTとBoTの両方を考慮することの重要性がさらに示されたんだ。

まとめ

PathEXの使用とIoTおよびBoTの概念は、ホールスライド画像の分析において有望な進展を提供するよ。従来のタイル抽出方法に関連する課題に対処することで、新しいアプローチは研究者が機械学習モデルのトレーニングにより正確なデータセットを作成できるようにするんだ。

これらの発見は、医療専門家がデジタル病理学を使用して病気を診断し理解する方法を改善する大きな可能性を持ってるよ。技術が進化する中で、癌のような状態を診断する際の正確性と効率を高め、最終的には患者の結果を向上させることが目標なんだ。

オリジナルソース

タイトル: PathEX: Make Good Choice for Whole Slide Image Extraction

概要: BackgroundThe tile-based approach has been widely used for slide-level predictions in whole slide image (WSI) analysis. However, the irregular shapes and variable dimensions of tumor regions pose challenges for the process. To address this issue, we proposed PathEX, a framework that integrates intersection over tile (IoT) and background over tile (BoT) algorithms to extract tile images around boundaries of annotated regions while excluding the blank tile images within these regions. MethodsWe developed PathEX, which incorporated IoT and BoT into tile extraction, for training a classification model in CAM (239 WSIs) and PAIP (40 WSIs) datasets. By adjusting the IoT and BoT parameters, we generated eight training sets and corresponding models for each dataset. The performance of PathEX was assessed on the testing set comprising 13,076 tile images from 48 WSIs of CAM dataset and 6,391 tile images from 10 WSIs of PAIP dataset. ResultsPathEX could extract tile images around boundaries of annotated region differently by adjusting the IoT parameter, while exclusion of blank tile images within annotated regions achieved by setting the BoT parameter. As adjusting IoT from 0.1 to 1.0, and 1 - BoT from 0.0 to 0.5, we got 8 train sets. Experimentation revealed that set C demonstrates potential as the most optimal candidate. Nevertheless, a combination of IoT values ranging from 0.2 to 0.5 and 1-BoT values ranging from 0.2 to 0.5 also yielded favorable outcomes. ConclusionsIn this study, we proposed PathEX, a framework that integrates IoT and BoT algorithms for tile image extraction at the boundaries of annotated regions while excluding blank tiles within these regions. Researchers can conveniently set the thresholds for IoT and BoT to facilitate tile image extraction in their own studies. The insights gained from this research provide valuable guidance for tile image extraction in digital pathology applications.

著者: Xinda Yang, R. Zhang, Y. Zhang, K. Chen

最終更新: 2024-02-22 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.20.581147

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.20.581147.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事