低用量マンモグラフィーによる乳腺密度の評価
この研究は、低線量マンモグラムを使った乳腺密度の評価を分析してるよ。
― 1 分で読む
乳がんは、特に50歳未満の女性にとって重大な健康問題だよね。家族に乳がんの人がいる女性は、リスクが高いんだ。早期に乳がんを見つける方法を見つけることが、命を救うことに繋がる。検査を受けることで、この病気による死亡率を下げることができる。でも、家族に乳がんの人がいない若い女性でも、乳がんにかかることがあるんだ。どの若い女性が早期検査の恩恵を受けるかを見極めることが、がんを早く見つけて予防治療を提供するために重要なんだよ。
マンモグラムで見える乳腺密度が高いと、乳がんのリスクが高まることがわかってる。乳腺密度が高い女性を特定できれば、リスクを下げる薬の投与や、早期に問題を見つけるための頻繁なチェックができるんだ。
マンモグラムで乳腺密度を測る方法はいくつかあって、機械で行うものもあれば、訓練を受けた医師が行うものもあるんだ。医師の時間が限られてるから、自動化された方法を使うことで、もっと複雑な作業に集中できるようになるんだよ。
若い女性がルーチンの検査を受けないことが多いのは、放射線被曝の懸念があるからだよね。低線量マンモグラフィが若い女性の乳腺密度を評価するための安全な選択肢として研究されていて、将来の検査プランをカスタマイズする手助けになるかもしれない。
最近のディープラーニング技術の進展で、低線量のマンモグラムから乳腺密度を予測できる可能性が示されてる。このことは、若い女性のがんリスクを評価するために低線量マンモグラムを使う可能性を広げるんだ。でも、低線量マンモグラムの予測が標準線量のものとどれくらい一致するかを確認するための証拠がもっと必要だよ。低品質の画像だと、特定の特徴がはっきり見えないことがあって、誤った予測に繋がる懸念があるんだ。
この記事は、これらの予測にどこで不確実性が生じるか、どれだけ信頼できるか、そして不確実性を減らす方法を調査することに焦点を当ててる。具体的には、低線量マンモグラムが乳腺密度や乳がんリスクをどれほど正確に推定できるか、またこれらの画像の予測が標準線量の画像とどう比較されるかを見たいんだ。
研究目的
この研究の目的は、低線量マンモグラムから乳腺密度をどれくらい正確に推定できるか、標準マンモグラムと比べて調べることだよ。それには、2つのデータセットを使うつもり。
一つ目は、ALDRAM(Automated Low Dose Risk Assessment Mammography)データセット。これは、30歳から45歳の女性が対象で、全員が以前に乳がんと診断されていて、年に一度のマンモグラムを受けたいと思ってる人たちだ。この女性たちは、マンチェスターの特定の病院で治療を受けてたんだ。
各参加者に対して、標準線量と低線量のマンモグラムが撮影されたよ。最初に標準線量の画像が撮影され、その後、同じ位置で低線量の画像が撮影された。これによって、直接的に比較できるようになってるんだ。
ALDRAMデータセットには147セットの画像が含まれていて、サイズもいろいろ。女性の年齢は31歳から45歳で、他の関連研究の平均年齢よりも若いんだ。ALDRAMの画像は、低線量と標準線量の間の露出比もさまざまなんだ。
ALDRAMデータセットは小さくて、乳腺密度に関する特定のラベルが欠けてるけど、別のデータセットであるPROCASを使ってモデルをトレーニングして予測を検証する予定。PROCASデータセットには、さまざまな年齢や乳腺密度の女性のマンモグラムが含まれてるよ。
画像準備
両方のデータセットからの画像は、一貫性を確保するために前処理された。サイズを変更したり、正規化したり、ピクセルの強度を標準化したりしてる。小さい画像にはパディングが施されて、共通のサイズに合わせてるんだ。
モデルとトレーニング
この研究では、PROCASの標準線量画像用と、シミュレートされた低線量画像用の2つのモデルセットをトレーニングしたよ。どちらのモデルも、ResNetというよく知られたディープラーニングモデルに基づいてる。モデルは乳腺密度を予測することを学んで、医師からの既知の密度スコアと照らし合わせてチェックされたんだ。
モデルはパフォーマンスや予測の一致度に基づいて評価された。このプロセスを通じて、低線量の予測が標準線量の予測とどれだけ比較できるかを確認したかったんだ。
分析アプローチ
低線量画像からの予測にどれくらい信頼を置けるかを理解するために、予測に影響を与える可能性のある異なる変数を調査したよ。
一つの問題は、マンモグラムの視点によって予測が変わること。画像を撮る方法は色々あるから、同じ乳房の2つの異なる視点では異なる結果が得られるかもしれない。それに、異なるモデルを使って予測すると、出力も変わるかもしれない。
研究で使う画像のサイズも考慮すべき点だよね。マンモグラムのサイズのバリエーションが予測パフォーマンスに影響を与えるかもしれない。さらに、若い年齢層や乳腺密度のレベルも、モデルが正しく予測する能力に影響を与えるかもしれない。
結果
予測の質
PROCASのテストセットで乳腺密度を予測する際に、最高のパフォーマンスを発揮したモデルがどうだったかを調べたよ。いくつかのモデルは全体的な放射線科医のスコアに対して良い性能を示したけど、私たちが本当に興味を持ってたのは、低線量と標準線量の予測の比較。
視点の違い
異なるマンモグラムビュー(CCやMLOなど)に対する予測が異なる結果を生むことに気づいたよ。低線量画像では、標準線量よりも違いが少し大きかった。結果を比較してみると、視点による予測のバリエーションは、線量によるものと同じくらいかもしれない。
予測の組み合わせ
異なる視点からの予測を組み合わせることで、低線量と標準線量の予測の類似性が改善されることがわかったよ。これから、複数の視点を考慮することで、全体的に良い結果が得られるかもしれないね。
モデリングの変動性
複数のモデルの結果を組み合わせる影響もテストしたよ。異なるモデルからの予測を平均化すると、標準線量と低線量の予測の類似性が向上することがわかったんだ。
変動要因
低線量予測の精度に影響を与えるさまざまな要因を調べたよ。
- 年齢: 異なる年齢層で予測の差を見たけど、特に影響はなかったよ。
- 密度スコア: 乳腺密度が高いほど、予測パフォーマンスの大きな差が見られたから、密度が高い乳房は正確な密度推定をするのが難しいかもしれないね。
- 乳房のサイズ: 小さい乳房はモデルのパフォーマンスが悪いようだった。研究では、小さい乳房が密度の高い組織に関連してることが示されて、予測プロセスに複雑さが増すことになるんだ。
結論
結果から、低線量マンモグラムと標準線量マンモグラムで似たような予測が得られる可能性があることがわかったよ。複数の視点やモデルからの予測を組み合わせることで、違いを減らすことができるけど、乳腺密度やサイズのような特定の要因が予測にばらつきをもたらすことも明らかになった。これらの関係を完全に理解し、予測精度を改善するためにさらに探求する必要があるね。
タイトル: Capability and reliability of deep learning models to make density predictions on low dose mammograms
概要: PurposeBreast density is associated with risk of developing cancer and can be automatically estimated, using deep learning models, from digital mammograms. Our aim is to estimate the capacity and reliability of such models to estimate density from low dose mammograms taken to enable risk estimates for younger women. MethodsWe trained deep learning models on standard and simulated low dose mammograms. The models were then tested on a mammography data-set with paired standard and low-dose image. The effect of different factors (including age, density and dose ratio) on the differences between predictions on standard and low dose are analysed. Methods to improve performance are assessed and factors that reduce model quality are demonstrated. ResultsWe showed that whilst many factors have no significant effect on the quality of low dose density prediction both density and breast area have an impact. For example correlation between density predictions on low and standard dose images of breasts with the largest breast area is 0.985 (0.949-0.995) while with the smallest is 0.882 (0.697-0.961). We also demonstrated that averaging across CC-MLO images and across repeatedly trained models can improve predictive performance. ConclusionLow dose mammography can be used to produce density and risk estimates that are comparable to standard dose images. Averaging across CC-MLO and across model predictions should improve this performance. Model quality is reduced when making predictions on denser and smaller breasts. Code is available at: https://github.com/stevensquires/
著者: Steven Squires, A. Mackenzie, D. G. Evans, S. J. Howell, S. M. Astley
最終更新: 2024-01-02 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.01.01.23300313
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.01.01.23300313.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。