Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 放射線学と画像診断

深層学習を用いた医療画像セグメンテーションの進展

新しい技術が胸部X線写真のセグメンテーション精度を向上させる。

― 1 分で読む


AI駆動の画像セグメンテーAI駆動の画像セグメンテーションのブレークスルーる。新しい方法が医療診断の画像精度を向上させ
目次

最近の人工知能の進展、特にディープラーニングのおかげで、医療画像の分析がかなり改善されたんだ。この進歩は、画像の不同部分を特定する画像セグメンテーションのようなタスクに特に影響を与えている。たとえば、AIを使って乳房病変をセグメントしたり、肺癌の異なるステージを分類したり、組織タイプを特徴付けたり、心臓肥大を検出したりできるようになった。

放射線科では、セグメンテーションが病気の診断や治療に欠かせないんだけど、ディープラーニング技術はうまく機能するために大量のトレーニングデータを必要とするんだ。このデータの膨大な必要性が、新しい画像セグメンテーション手法の開発につながった。特に完全畳み込みネットワーク(FCN)は、画像全体を扱うことで詳細なセマンティックセグメンテーションを可能にした。FCNの改良版であるU-Netモデルは、少ないトレーニングサンプルでより多くのコンテキストを捉えられるから、X線、MRI、CTスキャンなどさまざまなソースからの医療画像のセグメンテーションに人気なんだ。

ディープラーニング技術が一般的になる前は、画像強調が医療画像の分析に重要な役割を果たしていた。人気のある強調技術の一つは適応ヒストグラム均等化で、画像を小さなセクションに分けて局所的なコントラストを強化するもの。さらに進化したバージョンであるコントラスト制限適応ヒストグラム均等化(CLAHE)が開発され、コントラストを制御し、ノイズを減少させることができる。最近の研究では、CLAHEが糖尿病網膜症の段階予測やCOVID-19などの感染症分類のようなディープラーニングタスクに大きな利益をもたらすことが示された。

私たちの研究では、画像の前処理のためにps-KDEという新しい手法を導入した。この技術は、主に胸部X線画像のセグメンテーション結果を改善することを目的としている。ps-KDEには、1) トレーニングデータを増やすシンプルで適応可能な方法を提供、2) 胸部X線の重要な臓器を正確にセグメントするのに効果的、3) 生成されたヒートマップを使ってセグメンテーションアルゴリズムを評価する手助けをする、という三つの主要な利点がある。

データと手法

私たちは、日本とアメリカの複数の機関から収集した247枚の胸部X線画像を含む公開データベースを使用した。画像は放射線組織から提供され、特定の解剖学的構造を示す手動アノテーションが含まれていた。各画像はグレースケール形式で、心臓、左肺、右肺、左鎖骨、右鎖骨を強調する五つのバイナリーマスクが付いている。

データセットには肺結節のある人とない人が混在していた。結節のある患者の性別分布は男性68人、女性86人で、結節のない患者は男性51人、女性42人だった。結節のある患者の平均年齢は60歳だった。

私たちの研究は倫理基準に従ったもので、公開データだけを使用し、倫理委員会のレビューを必要としなかった。参加者に関する特定の情報は持っていなかったことを確認した。

データ拡張

ディープラーニングモデルを効果的にトレーニングするには、大規模なデータセットが重要だ。大規模なデータセットが利用できないとき、データ拡張が過剰適合を防ぐために不可欠になる。私たちの研究では、元の画像とそれに対応するマスクの両方に対して五つの種類の拡張を適用し、解剖学的構造が正確に表現されるようにした。拡張には回転、反転、ズーム、サイズ変更が含まれている。

すべての画像は256x256ピクセルにリサイズされ、モデルが迅速かつ一貫してトレーニングできるように0から1の範囲に変更した。

画像前処理

コントラスト制限適応ヒストグラム均等化(CLAHE)

ヒストグラム均等化は、画像コントラストを改善するために一般的に使用される手法だ。ピクセル値を再分配して、より均一な外観を作り出す。しかし、ほとんどの画像がすでに広範囲の強度を使っているため、この方法の効果は限られることがある。これを克服するために、適応ヒストグラム均等化(AHE)は、画像を小さなセクションに分けて独立して強化する。

CLAHEは、特定の領域でコントラストを制限することでAHEを改善し、ノイズを減少させつつ局所の詳細を強化する。この方法はさまざまな研究で成功裏に適用され、重要な利益を示している。

カーネル密度推定によるピクセル単位の置換(ps-KDE)

初期データ調査中に、臓器間でピクセル値の分布が異なることが分かった。私たちは、カーネル密度推定(KDE)を使用して、各臓器のピクセル値の確率密度関数(PDF)を作成した。元のピクセル値を対応する密度に置き換えることで、より均一で効果的な前処理法を達成することを目指した。

この手法により、ピクセル値を頻度に置き換え、各臓器内で一般的に発生するピクセル値により大きな値を与えることができた。

モデル開発

胸部X線画像のセグメンテーションを行うために、セグメンテーションタスクに適したU-Netアーキテクチャを使った。このネットワークは、収縮経路と拡張経路を持つ構造になっている。収縮経路は特徴を抽出し、拡張経路は元の入力サイズに復元する。

モデルは、ディープラーニング能力で知られるResNet34バックボーンを組み合わせたU-Netデザインを使用するPythonパッケージを使って実装した。この二つのモデルの組み合わせは、セグメンテーション性能を向上させることを目的としている。

モデルを効果的にトレーニングするために、モデルが予測から学ぶのを助けるさまざまな損失関数を使用した。これらの関数は、モデルの出力が実際のデータにどれだけ合致しているかを測定し、パフォーマンスを向上させるための指針を提供する。

モデル評価と解釈性

モデルのパフォーマンスを評価するために、IoU(交差部分の和)やDice係数などの指標を使用した。これにより、予測されたセグメントが実際のデータとどれだけ一致しているかを測定できた。

トレーニング後、元の画像、CLAHE処理された画像、新しいps-KDE法で処理された画像を使ってモデルのパフォーマンスを調べた。この分析により、さまざまな前処理技術の効果を比較し、セグメンテーションタスクに対する影響を理解することができた。

結果は、CLAHEを使ったモデルがps-KDEを使用したモデルよりも全体的に良好なパフォーマンスを示したことを示していた。ただ、ps-KDEは特定の領域で強みを示していて、今後の研究での併用アプローチの可能性を示唆していた。

生成されたヒートマップは、モデルの信頼性やさらなる調査が必要な領域についての洞察を提供した。モデルは一貫したパターンを示し、特に肺や心臓のような大きな構造周辺の信頼性のあるセグメンテーションを示していた。

今後の方向性

私たちの発見は有望だけど、いくつかの制限もあった。データセットがディープラーニングアプリケーションにしては比較的小さく、リソースの制約から限られたエポック数しかトレーニングできなかった。だから、データセットのサイズとトレーニングエポック数を増やすことで、将来的にはより良い結果が得られる可能性がある。

それに、私たちの研究ではPNG画像を使用したけど、臨床の実践では通常DICOMフォーマットに依存している。私たちの発見の実世界での適用性を高めるためには、DICOMデータに合わせてモデルをさらに適応させる必要がある。これらのギャップを埋めることで、研究と臨床ワークフローの間の橋渡しができるようになる。

結論として、私たちの研究は、ps-KDEアプローチが胸部X線画像のセグメンテーション精度を向上させる可能性を強調している。セグメンテーション能力の改善に向けて重要な進展を遂げたものの、この新しい技術の利点を完全に実現するためには、さらなる探求と検証が必要だ。

オリジナルソース

タイトル: Enhancing Semantic Segmentation in Chest X-Ray Images through Image Preprocessing: ps-KDE for Pixel-wise Substitution by Kernel Density Estimation

概要: BackgroundDeep-learning-based semantic segmentation algorithms, in combination with image preprocessing techniques, can reduce the need for human annotation and advance disease classification. Among established preprocessing techniques, CLAHE has demonstrated efficacy in enhancing the segmentations algorithms across various modalities. MethodThis study proposes a novel preprocessing technique, ps-KDE, to investigate its impact on deep learning algorithms to segment major organs in posterior-anterior chest X-rays. Ps-KDE augments image contrast by substituting pixel values based on their normalized frequency across all images. Our approach employs a U-Net architecture with ResNet34 (pre-trained on ImageNet) serving as the decoder. Five separate models are trained to segment the heart, left lung, right lung, left clavicle, and right clavicle. ResultsThe model trained to segment the left lung using ps-KDE achieved a Dice score of 0.780 (SD=0.13), while that trained on CLAHE achieved a Dice score of 0.717 (SD=0.19), p

著者: Zifan Gu, Y. Wang, Y. Guo, Z. Wang, L. Yu, Y. Yan

最終更新: 2024-02-17 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871

ソースPDF: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事