CNNを使った乳がん検出の進展
自動化手法は機械学習を使って乳がんの診断精度を向上させる。
― 1 分で読む
目次
乳がんは世界で最も一般的ながんで、2020年には220万件以上の症例が報告されたんだ。女性のうち約12人に1人が生涯で乳がんになるし、年齢に関係なく影響を受けることがあるけど、40歳を超えるとリスクが大幅に増える。症例の約半分は、女性で年齢が高い以外に明確なリスク因子がない女性に見られる。リスクを高める要因には肥満、高アルコール消費、家族病歴、放射線への曝露、タバコの使用、閉経後のホルモン療法、妊娠歴などがあるよ。
乳がんは、乳腺組織の細胞が制御不能に増殖して腫瘍ができることで発生する。最も一般的なタイプは浸潤性乳管癌で、約80%を占めていて、浸潤性小葉癌は約10-12%だよ。マンモグラフィーは乳がん診断の標準的な方法で、最小限の侵襲性があるんだ。さらなる診断が必要な場合は、バイオプシーでがんの存在を確認できる。
1980年以降、先進国では乳がんによる死亡率が40%減少していて、これはリスクのある女性に対する定期的なマンモグラム検査のおかげなんだ。早期発見と治療が生存率の改善には非常に大切。所得の高い国と低い国で生存率には大きな違いがあって、これは診断にかかるコストと放射線科医の専門知識に関連しているんだ。放射線科医はマンモグラフィーを分析して小さな白い斑点(石灰化)、大きな異常なエリア、そしてがんを示唆する他の兆候を探す。乳腺組織の密度も影響を与えて、密な乳腺の女性では問題の検出が難しくなる。また、マンモグラム検査は多くの偽陽性を引き起こすことがあって、患者に不必要な不安や追加の検査をもたらすことがある。
こうした課題は、マンモグラムによる乳がん診断のための新しいツールの研究を促進している。一つの有望なアプローチは、自動化システムを使って医療画像を分析し、「事前診断」結果を提供する方法で、専門家がそれを確認できるようにすることだ。この技術には機械学習手法、特に畳み込みニューラルネットワーク(CNN)というディープラーニングの一種が使われる。CNNはトレーニングデータを分析して、分類を助ける特徴を抽出する。これは古い機械学習手法、例えば多層パーセプトロン(MLP)、サポートベクターマシン(SVM)、決定木よりも利点がある。CNNはトレーニング中に特徴を自動的に抽出するから、手動での選択や特徴工学の必要がないんだ。
機械学習
データを適切に扱うことで、医療を含むさまざまな分野で多くの利点が得られるよ。これには意思決定を助け、コストを下げ、市場の理解を深めるなどがある。臨床環境では、カスタムアルゴリズムの開発によって、早期の病気診断、疫病のコントロール改善、入院予測、医療エラーの削減ができるんだ。これらの利点は、データ管理の複雑な問題に取り組む研究者にとって貴重なサポートを提供する。
機械学習は人工知能の一部で、データからルールを自動的に学習することを可能にする。これは、あらかじめ定義されたルールに依存する伝統的なプログラミングとは対照的だ。機械学習は音声認識、画像理解、データ分析、天気予報など、さまざまなタスクを改善することができる。
ディープラーニングは機械学習の一分野で、特化した複数の層に組織されたニューラルネットワークを使う。ディープラーニングでは、最初の層が入力データから重要な特徴を抽出し、後の層が関連する決定を行う。ディープラーニングモデルの例には、CNN、領域ベース畳み込みネットワーク(R-CNN)、画像セグメンテーションのためのU-NET、順次データ処理のための長短期記憶(LSTM)ネットワークが含まれるよ。
最近、ディープラーニングは人工知能と機械学習の効果的な方法として浮上してきて、音響、画像処理、言語処理などの分野で優れたパフォーマンスを示している。医療画像でディープラーニングを使用する主な強みは、コンピューターの独自の能力で人間の意思決定を補完することだね。
CNNは生物学的な神経ネットワークと似たように機能して、一つのニューロンが別のニューロンからインパルスを受け取り、それを処理して接続されたニューロンにインパルスを送信する。人工ニューラルネットワークでは、接続には数値的な重みがあって、経験に基づいて調整され、出力値は活性化関数を通じて決定される。典型的なCNNは、入力層、出力層、畳み込み層、活性化層、その他の中間層を含んでいて、特徴抽出を強化している。
文献レビュー
最近の医学におけるCNN技術の応用には、アルツハイマー病の診断や認知機能の低下予測、肺がんの検出と分類、胸部X線での損傷の特定、皮膚疾患の認識、さらには植物疾患の検出が含まれる。乳がん検出に関する特定の研究では、有望な結果が示されている。例えば、いくつかのモデルはマンモグラムを処理する際に97.10%の精度を達成し、画像から大胸筋を取り除くなどの特定の詳細に対処している。
他の研究では、乳がん検出のためのコンピュータ支援診断システムが提案され、92.32%の精度で乳房サーモグラフィーを使用して訓練されたCNNモデルが作成された。乳房放射線検査データセットのさまざまなオーバーサンプリング戦略の比較では、成功率が19%から34%向上したことが示されたよ。
いくつかの研究で報告された精度は印象的だけど、特に不均衡なデータセットを扱うときには、単に精度を計算することは誤解を招く可能性がある。例えば、癌の事前確率が低い場合、「癌なし」と予測するシステムでも高い精度を達成するだろう。だから、精度や再現率のようなより細かな評価指標がより有益だよ。精度は、予測した陽性の中の真陽性の数を示し、陽性結果の信頼性を強調する。一方、再現率は真陽性の割合を実際の癌症例に対して示す。F1スコアは精度と再現率を一つの指標に統合して、両者のバランスが必要であることを強調する。いくつかの研究では、これらの指標が見落とされ、直接比較が難しくなっている。
クラス不均衡
臨床データを扱う上での大きな課題は、クラス間の不均衡で、陰性の症例が陽性のものよりも遥かに多いということだ。この不均衡を解決するためには、両方のクラスが適切に表現されるようにするために異なる方法が必要だよ。
クラス不均衡を管理するための伝統的なアプローチには、マイノリティクラスの例を増やす(オーバーサンプリング)か、マジョリティクラスの例を減らす(アンダーサンプリング)がある。時には両方の方法が組み合わされて、サンプル数の均等が達成される。最近の手法であるSMOTE(Synthetic Minority Over-sampling Technique)は、既存のマイノリティクラスの例から新しい合成サンプルを生成するんだ。
乳がん診断モデルを正確に開発し、侵襲的な検査の必要を減らすために、健康なまたはがん性のマンモグラムを分類するためのCNNを使用するディープラーニングアプローチが提案されている。方法論には、データ処理と準備、さまざまなCNNアーキテクチャの実験、および結果の評価が含まれる。
全体の目標は、放射線科医がさらに注意が必要な患者を特定するために、患者の画像を自動で前分類できるコンピュータアプリケーションを作成することなんだ。
材料と方法
放射線科医の診断の精度と効率を改善し、患者ケアを向上させるための目的は、機械学習を使用してスクリーニングマンモグラムの分類を自動化することだ。初めはMATLAB環境で開発を進め、最終的にはよりユーザーフレンドリーな環境、例えばWindowsアプリケーションにシステムを移行することを目指している。
ニューラルネットワークのトレーニング用データセットには、Kaggleを通して北米放射線学会から取り寄せた54,707枚の画像が含まれている。このデータセットは、クランio-caudal(CC)、中外斜位(MLO)、中外(ML)、および外中(LM)の4つの投影タイプのマンモグラムで構成されている。癌の症例はCCとMLO投影のみに存在するため、他の2つのあまり一般的でない種類は省かれている。
CNNを設計する前に、すべての画像のフォーマットと特性を標準化する必要がある。このデータセットは、患者番号で分類された画像とCSVファイルの追加データで構成されている。各患者のフォルダーには、両方の乳房(CCとMLO)から撮影された複数の画像が含まれている。画像には異なる投影タイプが含まれ、重複がある場合もあるので、前処理により一貫性が確保される。
前処理の段階では、マンモグラムを調整し、画像を反転させて共通の向きを保ち、乳腺密度に基づいてコントラストを調整し、256x256ピクセルにリサイズし、ピクセル値を正規化する。追加の前処理ステップでは、マンモグラム内の最大のオブジェクト(乳房)を検出し、このエリアに焦点を合わせて画像をクロップし、同じサイズにリスケールする。これにより、関心のある領域が重要な詳細を失うことなくより大きなスペースを占めることができる。
クラス不均衡への対処
データセットには元々54,707枚の画像が含まれているが、CC投影で癌を示すのは566枚、MLO投影では590枚だけで、健康なクラスと病気のクラスの間に著しい不均衡が存在する。これに対処するために、いくつかの方法が採用されている。
まず、アンダーサンプリングを適用してマジョリティクラスを削減し、CCとMLOの画像を合計1,132枚(CCは566枚、MLOは590枚)に減らす。次に、マイノリティクラスはrandReplicateFiles
という関数を使用して増強され、健常画像を最終的に3倍にする。
もう一つのオーバーサンプリングのオプションは、ForgeImage
関数を使用して、ランダムノイズやわずかな幾何学的修正を加えて視覚的に似ているが異なる画像を生成し、ネットワークが同じ基になるデータの多様な表現で訓練できるようにすることだ。
CNNデザイン
CNNのパフォーマンスはそのアーキテクチャに大きく依存していて、層の数や種類、使用するフィルターの数を決める必要がある。CNNの設計は、フィルタリング層の数、それらのサイズ、活性化関数、完全結合層を設定することを含む。アーキテクチャは通常、入力層、畳み込み層、プーリング層、および完全結合層を含む。
入力層は2D画像を扱い、データを正規化する。一方、畳み込み層はピクセルグループを繰り返し処理して、計算の大部分を実行する。複数のフィルターが、新しい出力画像を生成し、入力画像の異なる特徴を捉える。畳み込みの後、正規化と活性化関数が適用されることが多く、たいていはReLU関数を使用し、プーリング層はデータボリュームを減らしながら重要な情報を保持する。
CNNのアーキテクチャを定義した後、トレーニングが始まって、期待される出力と実際の出力の間の誤差を最小化することを目指して数値的なパラメータ(フィルター係数や層の重み)が調整される。特定のトレーニング方法、モメンタムを使った確率的勾配降下法が、損失関数の勾配に基づいてパラメータを更新するために使用される。この段階では、異なる画像前処理方法やオーバーサンプリング技術がテストされる。
トレーニングが終了したら、過学習の懸念を軽減するために別のデータセットでCNNが評価される。CNNは通常、トータルのマンモグラムの80%から90%でトレーニングされる。
評価測定
CNNをトレーニングした後、各ネットワークの質を評価するために、精度、混同行列、精度、再現率、F1スコアなどのさまざまなパラメータが計算される。これらの測定値は、ネットワークの分類能力についての洞察を提供する。
精度は正しく分類されたサンプルの割合を反映するけど、クラス不均衡のデータセットでは誤解を招くことがあって、ネットワークがマジョリティクラスを優先する可能性がある。だから、混同行列がより有益で、クラスの予測と実際のクラスの詳細な洞察を提供する。
混同行列から、精度(予測した陽性の中の真陽性の割合)と再現率(真の症例が特定された割合)が導かれる。F1スコアは、精度と再現率を一つの指標に統合して、両者のバランスを取ることの重要性を強調する。
いくつかの研究は精度のみに焦点を当て、精度と再現率を見落としていることが多いけど、F1スコアや関連する指標を評価することは医療診断で特に重要だよ。
グローバルテスト
トレーニングとバリデーションの後、CNNのパフォーマンスを広範な画像セットで評価するために、グローバルテストが行われる。このグローバルテストでは、患者の画像を癌の診断に従って分類するために設計されたMATLABプログラムを使用する。プログラムは患者フォルダ、画像、以前にトレーニングされたネットワークを処理して、テスト結果に基づいて精度、再現率、F1スコア、精度、混同行列の値を計算する。
画像用と患者用の2つの異なる出力が生成される。いずれかの乳房が病気として分類されれば、その患者は全体として病気と見なされる。プログラムはDICOM画像を処理し、選択した前処理方法を適用し、その後データを適切に分類する。
このグローバルテストは、以前にテストされていない画像を含み、臨床環境における典型的なクラスの不均衡を反映するため、実際のパフォーマンスを評価する上で重要なんだ。
結果と議論
提案されたアルゴリズムはMATLABを使用して実装され、画像処理、CNNトレーニング、バランス技術が含まれる。画像はトレーニングのためにCNNに投入される前に、2つの方法で前処理される。
MATLABでCNNを構成するためには、入力、畳み込み、正規化、最大プーリング、完全結合、ソフトマックス、分類層などの様々な層を定義する特定の指示が必要だよ。
オーバーサンプリングなしのネットワークトレーニング
最初のテストでは、CC投影のマンモグラムを使用してCNNをトレーニングした。このデータセットは1,132枚の画像を含み、各クラスから566枚取得されている。ネットワークは最大20エポックに達し、モデルが過学習していることを示していて、これは検証曲線が約53%の精度で平坦になっていることから明らかだった。
MLO投影画像を使用した場合も、同様の過学習パターンが現れ、クラスの不均衡が原因であることがわかった。CCとMLO画像の組み合わせデータセットでのトレーニングは同様の結果をもたらし、強い不均衡が効果的な学習を妨げていることを強化する結果となった。
オーバーサンプリングありのネットワークトレーニング
以前のトレーニングの制限に対処するために、オーバーサンプリングが最初にシンプルなファイル複製を通じて、次にマイノリティクラスをさまざまな方法で強化することで実施された。これにより、精度が約53%から約90%に増加し、平均二乗誤差が顕著に減少した。
さらに大きなデータセットを含む追加のテストでは、マイノリティクラス画像を3倍および4倍に増やすことが試みられた。結果は、3倍が4倍よりも良い結果を示し、過剰な繰り返しが過学習を引き起こすかもしれないことを示唆している。
オーバーサンプリング手法の比較
初期のオーバーサンプリング技法が評価された後、ForgeImage
メソッドの効果が検証された。この方法は新しい画像を生成したが、結果はシンプルな複製方法と比較してあまり良くない結果だった。これは、がん検出に影響を及ぼすような微小な、検出できない差異が原因かもしれない。
また、Matlabの画像増強ツールを使用した場合、期待した改善が得られなかった。このシナリオでは、画像内の一貫したオブジェクトの位置とサイズがその効果を減少させる可能性がある。
前処理方法2を用いたネットワークトレーニング
以前のトレーニングセッションの後、乳房領域のみに焦点を当てた新しい前処理方法がテストされた。しかし、結果は以前の方法と比較して全体的なパフォーマンスが低く、特に再現率が低かった。
実験は良好な結果を示したが、分類プログラムの重要性は、放射線科医がさらに検査を必要とする患者を特定する能力にある。それによって、従来のスクリーニングを支援する役割を果たすことが期待されている。
CNNが新しいデータセットからCCおよびMLO投影の画像を分類すると、がん症例の検出において驚くべき再現率が100%近くに達した。このことは、医療専門家が正確な診断を下すサポートとなる可能性を示している。
結論と今後の課題
このプロジェクトの目標は、マンモグラムの自動分類を通じて乳がんを効果的に診断する方法を作ることだった。研究では、画像から特徴を抽出して正確な予測を行うCNN設計に焦点を当てた。
トレーニングに影響を与える重要な要因には、画像解像度、前処理技術、およびオーバーサンプリング戦略が含まれる。この研究は、特に偽陰性が深刻な結果をもたらす医療シナリオにおいて、クラスのバランスが最適な結果を得るために重要であることを確認した。
全体として、モデルは高い再現率を示し、医療専門家に初期スクリーニングの補助を提供する際の有用性を示唆している。改善に向けた次のステップには、データセットの拡大、新しいデータセットの統合、およびCNNアーキテクチャや前処理方法のさらなる洗練が含まれ、パフォーマンスを向上させて偽陽性を減らすことが期待されている。
将来的には、臨床環境での広範なアクセスを提供するために、この方法を別のプログラミング言語に移行することも検討される。
タイトル: Helping Breast Cancer Diagnosis on Mammographies using Convolutional Neural Networks
概要: In this paper a study about breast cancer detection is presented. Mammography images in DICOM format are processed using Convolutional Neural Networks (CNNs) to get a pre-diagnosis. Of course, this preliminary result needs to be checked by a trained radiologist. CNNs are trained and checked using a big database that is publicly available. Standard measurements for success are computed (accuracy, precision, recall) obtaining outstanding results better than other examples from the literature.
著者: Fernando Martín-Rodríguez, R. Garcia-Mojon, F. Martin-Rodriguez, M. Fernandez-Barciela
最終更新: 2024-08-01 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.07.31.24311257
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.07.31.24311257.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。