不確実性を考慮した方法で医療画像のセグメンテーションを適応させる
新しいアプローチが、さまざまなソースでの医療画像のセグメンテーションを向上させる。
― 1 分で読む
医療画像セグメンテーションは、医療において重要なタスクで、臓器や腫瘍などの医療画像内の異なる構造を特定するのに役立つ。ただし、このタスクのための効果的なモデルを開発するのは難しいことが多い、特に訓練に使う画像が実際のシナリオで遭遇するものとは異なる場合。これは、 imaging 機器、プロトコル、または患者の特性の違いによってよく起こる。この研究の目的は、ターゲットドメインからの追加のラベル付きデータを必要とせずに、異なるソースからの画像の間のギャップを埋めるのに役立つ新しい方法を提示すること。
ドメインギャップの課題
モデルが一連の画像を使って訓練されると、通常は似た画像ではうまく機能する。しかし、スキャンの種類などの要因によって異なって見える画像に直面したとき、性能が大きく低下することがある。このギャップは「ドメインギャップ」として知られている。あらゆる可能なバリエーションからラベル付き画像を収集するのは実用的ではないため、デプロイ後に新しいラベルなし画像にモデルを適応させる必要がある。
ドメイン適応アプローチ
ドメイン適応(DA)は、モデルが異なる種類の画像でもうまく機能するように調整することを目的とした技術だ。従来の方法は、モデルが新しいドメインのラベルなし画像を使って調整する「非監視ドメイン適応(UDA)」を含むことが多い。ほとんどのUDA手法は、ソース(訓練)画像とターゲット(新しい)画像に同時にアクセスする必要があるが、これは実際には常に可能ではない。
既存のいくつかの方法は、画像の回転を予測したり、基本的な画像処理を行ったりするような補助タスクを使ってモデルの適応を助ける。しかし、これらの方法は追加の複雑さをもたらし、すべてのシナリオに合うとは限らない特定の訓練条件を必要とする。特定のモデルや訓練方法に依存しない、より柔軟なアプローチが必要だ。
提案する方法:不確実性に配慮した擬似ラベルガイド適応
これらの課題に対処するために、ターゲットドメインからのラベル付き画像が無くても機能し、さまざまなモデルに適応する簡単な方法を提案する。私たちのアプローチは、モデルが行った複数の予測から信頼できる擬似ラベルを生成することに焦点を当てており、これが性能向上と誤った予測のリスクを減らす。
信頼できる擬似ラベルの構築
私たちの方法では、複数の予測ヘッドを使用して擬似ラベルを生成するモデルの能力を強化する。入力や予測を少し調整することで、モデルは多様な結果を作り出す。この予測を組み合わせることで、モデルがこれまで見たことのない画像のために、より信頼性の高い擬似ラベルを形成できる。
次に、さまざまなヘッド間で予測がどれだけ一貫性があるかに基づいて、これらの擬似ラベルの信頼性を評価する。高い信頼度で全ヘッドにわたって一貫して現れる予測は、信頼できるとみなされる。この方法で、信頼できない予測をフィルタリングし、モデルが新しいデータに適応する際に最良の情報のみを使用することを保証する。
自己訓練プロセス
適応性を向上させるために、自己訓練戦略を採用する。これは、モデルが以前の予測を使用して将来の予測を洗練させるということだ。この方法でモデルを訓練することで、新しい未確認の画像に対する性能を継続的に向上させることができる。このプロセスは、モデルを2回通過させる:最初は擬似ラベルを取得し、次はこれらのラベルに基づいてモデルを調整する。
この方法を使うことで、モデルが自らの予測に頼りすぎてしまう偏りを減らす手助けをする。代わりに、複数の予測を考慮することで学習のバランスを取り、全体の性能を大幅に向上させることが可能になる。
私たちのアプローチの利点
私たちの提案する方法は、いくつかの重要な利点を提供する:
柔軟性:特定の事前訓練戦略やモデル構造を必要とする多くの既存の方法とは異なり、私たちのアプローチは多様な事前訓練モデルで機能する。これにより、さまざまなシナリオや使用ケースで適用できる。
信頼性:複数のヘッドを使って予測を生成することで、各予測は信頼度に基づいて重み付けされるため、より信頼性の高い擬似ラベルを得られる。これにより、モデルが誤った予測に影響されることを防ぎ、より良い意思決定を確保する。
性能向上:実験結果は、私たちの方法が多くの最先端の方法を上回り、新しいドメインで追加のラベル付きデータなしで教師あり訓練と同等かそれ以上の結果を達成できることを示している。
実験結果
私たちの方法の効果を評価するために、心臓画像や胎児脳MRIスキャンなど、さまざまなデータセットを用いて実験を行った。その結果、私たちのアプローチは従来の方法に比べて常に優れた性能を示した。
心臓画像セグメンテーション
心臓画像セグメンテーションの場合、予測されたラベルと真のラベルとの重複を測るDice類似度係数において、顕著な改善を観察した。私たちの方法は他の方法を上回り、異なる画像シナリオに対する堅牢性と適応性を示した。
胎児脳セグメンテーション
胎児脳セグメンテーションタスクでも、私たちの方法は素晴らしい結果を示した。信頼できる擬似ラベルを効果的に生成し、画像プロトコルのバリエーションに適応することで、ターゲットドメインからの基準ラベルなしに高い精度を達成することができた。
メカニズムの理解
ターゲットドメインの成長
私たちの方法の重要な要素は、ターゲットドメイン成長(TDG)の概念で、入力画像を少し変えて複数の予測を生成することを含んでいる。こうすることで、モデルから多様な出力セットを作り出すことができ、信頼できる擬似ラベルを形成するために組み合わせられる。このステップで導入されるランダム性が、モデルが新しい画像に直面したときの一般化能力を向上させる。
マルチヘッド予測フレームワーク
モデルの予測ヘッドを複製することで、異なる予測からより多くの情報を集めることができる。この設計により、データのノイズや不規則性をフィルタリングしつつ、より情報に基づいた意思決定が可能になる。各ヘッドの出力は分析され、合意された予測のみが訓練用に残されるため、モデルの全体的な性能が強化される。
エントロピー最小化
信頼できる擬似ラベルを生成することに加えて、エントロピー最小化も適用する。この技術は、モデルが複数のヘッドで一貫した応答を出すように促すことで、予測の不確実性を減少させる。この一貫性が、予測の信頼性をさらに向上させ、モデルが新しいデータに適応する際の堅牢性を高める。
2回の前方通過監視
2回の前方通過監視戦略は、モデルが以前の予測に過度に依存しないようにする。過去の予測と新しい入力の間のバランスを維持することで、見たことのない画像に直面したときの失敗を減らすシステムを作る。
結論
要するに、私たちが提案する医療画像セグメンテーションの方法は、ドメイン適応の課題に対して強力で柔軟なソリューションを提供する。不確実性に配慮した擬似ラベルガイダンスを活用することで、ターゲットドメインからの追加のラベル付きデータなしでモデルを効率的に適応させることができる。このアプローチは、性能を向上させるだけでなく、医療画像のさまざまなシナリオに深層学習技術を応用する新しい可能性を開く。
将来に向けて、この方法を他の形態のセグメンテーションタスクに拡張する大きな可能性がある。目標は、医療画像におけるさまざまな課題に適応できる、より効果的で一般化可能なフレームワークを作り出し、最終的には医療提供者や患者に利益をもたらすことだ。
タイトル: UPL-SFDA: Uncertainty-aware Pseudo Label Guided Source-Free Domain Adaptation for Medical Image Segmentation
概要: Domain Adaptation (DA) is important for deep learning-based medical image segmentation models to deal with testing images from a new target domain. As the source-domain data are usually unavailable when a trained model is deployed at a new center, Source-Free Domain Adaptation (SFDA) is appealing for data and annotation-efficient adaptation to the target domain. However, existing SFDA methods have a limited performance due to lack of sufficient supervision with source-domain images unavailable and target-domain images unlabeled. We propose a novel Uncertainty-aware Pseudo Label guided (UPL) SFDA method for medical image segmentation. Specifically, we propose Target Domain Growing (TDG) to enhance the diversity of predictions in the target domain by duplicating the pre-trained model's prediction head multiple times with perturbations. The different predictions in these duplicated heads are used to obtain pseudo labels for unlabeled target-domain images and their uncertainty to identify reliable pseudo labels. We also propose a Twice Forward pass Supervision (TFS) strategy that uses reliable pseudo labels obtained in one forward pass to supervise predictions in the next forward pass. The adaptation is further regularized by a mean prediction-based entropy minimization term that encourages confident and consistent results in different prediction heads. UPL-SFDA was validated with a multi-site heart MRI segmentation dataset, a cross-modality fetal brain segmentation dataset, and a 3D fetal tissue segmentation dataset. It improved the average Dice by 5.54, 5.01 and 6.89 percentage points for the three tasks compared with the baseline, respectively, and outperformed several state-of-the-art SFDA methods.
著者: Jianghao Wu, Guotai Wang, Ran Gu, Tao Lu, Yinan Chen, Wentao Zhu, Tom Vercauteren, Sébastien Ourselin, Shaoting Zhang
最終更新: 2023-09-18 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2309.10244
ソースPDF: https://arxiv.org/pdf/2309.10244
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。