Simple Science

最先端の科学をわかりやすく解説

# 電気工学・システム科学# 画像・映像処理# コンピュータビジョンとパターン認識# ソフトウェア工学

SAM 2プラグインで医療画像の注釈を簡単にする

新しいプラグインで3Dスライサーの3D医療画像のラベリングが簡単になったよ。

― 1 分で読む


SAMSAM2プラグインが画像注釈を強化するよンプロセスを速める。新しいツールが医療画像のセグメンテーショ
目次

3D医療画像のラベル作成には時間がかかって、スキルのある人が必要なんだよね。いろんなツールがあるけど、やっぱり難しいこともある。一つのツール、「Segment Anything Model 2 (SAM 2)」は動画に注釈を付けるために作られたんだけど、これを3D医療画像用にアダプトして、3D Slicerっていう有名なソフトウェアと連携するプラグインを作ったんだ。

このプラグインを使えば、ユーザーは2D画像にポイントを置いてラベルを作成でき、そのラベルを3D画像の複数スライスに広げることができるよ。このプロセスは一方向にも両方向にもできるから、画像全体のアノテーションが楽になるんだ。俺たちはコードを公開したから、誰でも簡単に使えるよ。

医療画像セグメンテーションの重要性

医療画像のセグメンテーションは、医療画像を分析する際の重要な部分なんだ。体の部位や病気の可能性があるエリアを正確にアウトラインすることが必要で、CTやMRI、PET、超音波、X線などのさまざまなスキャンを使う。いいセグメンテーションは、医者がより良い診断を下したり、治療を計画したり、患者のケアを向上させるのに重要なんだ。

今の深層学習を使った方法は、セグメンテーション作業を自動化するのに優れているけど、こうした自動モデルを作るのはまだ専門家からの手動入力に大きく依存していて、それがコストも時間もかかるんだ。アノテーションプロセスを早くするために、ラベリングを手助けする訓練されたモデルを使うアプローチがあるよ。

現在のアプローチの課題

専門的に訓練されたモデルを使うと、医療画像の形式の多様性が課題になることがあるんだ。このバラエティは新しいタイプごとにモデルを再訓練する必要があることが多い。SAMはこの問題を助けるために、毎回再訓練することなくさまざまな種類の画像に対応できるソリューションを提供するために作られているんだ。また、セグメンテーションプロセス中にユーザーがインタラクトできるようにプロンプトを使用しているよ。

医療画像のアノテーションを早く正確にするために、SAMは医療画像データセットと連携するように調整されて、医療画像を分析・表示するオープンソースツールである3D Slicerに統合されているんだ。

SAM 2が3D画像でどう機能するか

医療画像はよく3D形式で、CTやMRIスキャンみたいなものだよね。これらの画像の完全な構造をより良く扱うために、SAMは3Dタスクに対応するように調整されているんだ。最近の改良、特にSAM 2は、先の予測からの情報を追跡する機能を追加して、動画での作業を簡単にしているよ。

3Dブロックを使った処理を行う他のモデルとは違って、SAM 2は元のSAM設計を基にして、3D画像をより効果的に扱えるようにしているんだ。医療画像との相性について研究も行われているよ。

3D Slicer用SAMプラグインの紹介

俺たちのプロジェクトでは、SAMとSAM 2を3D Slicerに接続するプラグインを開発したんだ。これにより、ユーザーは馴染みのあるツール内で簡単にアノテーションを作成できるよ。プラグインは、2Dと3Dの医療画像の両方に注釈を付けることができるんだ。

プラグインの主な機能

  1. 3D Slicerとの統合: プラグインは、3D画像の任意のスライスからスタートして、アノテーションを双方向に移動させることができるよ。

  2. プロンプトベースのセグメンテーション: ユーザーは、ポイントプロンプトやボックスを使ってセグメントしたいエリアをマークできる。

  3. チェックポイントの活用: プラグインは、ユーザーのニーズに基づいてパフォーマンスを改善できるように、SAMとSAM 2のすべての利用可能なチェックポイントで作業をすることを可能にしているよ。

2Dセグメンテーションのためのプラグインの使い方

このプラグインを使って、ユーザーは3D医療画像の2Dスライスにアノテーションを付けられるんだ。ユーザーは3D Slicerで具体的なプロンプトを提供する。セグメンテーションを開始する前に、SAMとSAM 2のすべてのチェックポイントから選ぶことができる。

ユーザーがセグメンテーションを始めるためにクリックすると、プラグインはユーザーの作業を保存するファイルを生成するから、新しいスライスをセグメントするたびに待つ必要がないんだ。この最初のステップの後、ユーザーは画像上に1つまたは複数のプロンプトポイントを置くことができ、SAMまたはSAM 2がそれを使ってセグメンテーションマスクを作成するよ。ユーザーはリアルタイムでプロンプトを調整して、マスクがどう変わるかを見ることができて、保存する前に決定できるんだ。

3Dセグメンテーションのためのプラグインの使い方

CTやMRIスキャンのような3D画像を扱うとき、各スライスは動画のフレームのように扱うんだ。これにより、ユーザーは特定のスライスにプロンプトを作成した後、SAM 2の動画機能だけで3D医療画像のすべてのスライスをセグメントできるよ。

ラベルの伝播の異なるモード

セグメンテーションのために、ラベルを広げる2つの異なる方法を提供しているよ:

  1. すべてのスライスへの伝播: ユーザーは選んだスライスにプロンプトを置いた後、すべての他のスライスにラベルを広げることができる。結果が満足いかない場合、ユーザーはセグメンテーションの質を改善するためにプロンプトを追加できる。これは画像の中央から始めるのに良い方法なんだ。

  2. 左または右への伝播: このモードでは、ユーザーはラベルを左または右にだけ広げることができる。これは、ユーザーが画像の片端の部分だけをターゲットにしたいときに便利だよ。このモードを使うとき、SAM 2はリセットされて以前のプロンプトは考慮されないから、より集中した調整が可能になるんだ。

セグメンテーションマスクの手動修正

SAMとSAM 2の機能にもかかわらず、ユーザーが多くのプロンプトを提供しても、間違いや不要なノイズが残ることがあるんだ。だから、ユーザーは3D Slicer内の手動ツールに頼って、最終結果を改善することができるよ。

将来のアップデートでは、SAM 2の動画機能のためにさまざまな入力方法をサポートする新しいオプションを追加する予定だから、ユーザーがアノテーションを作成する方法にさらに柔軟性を持たせられるんだ。

プラグインのパフォーマンス評価

SAM 2がどれだけうまく機能するかを評価するために、公的な医療データサンプルを使ってテストを行ったよ。テスト中、3つのポイントプロンプトをCTスキャンに置いて肝臓をセグメントすることに集中したり、MRIスキャンで腫瘍をターゲットにしたりしたんだ。ユーザーがプロンプトを置いた後、プラグインは両方向にセグメンテーションを生成するよ。

結果はボリュームのさまざまなスライスから集められて、ツールが異なる例にわたって役立つセグメンテーションマスクを提供する能力を示しているんだ。

結論

俺たちはSAM 2を3D Slicerに統合するプラグインを開発して、医療画像のアノテーションプロセスをスムーズで早くしたんだ。この新しい拡張により、SAM 2によって可能になった3Dセグメンテーションができるようになったけど、以前のバージョンでは2Dセグメンテーションしかサポートされていなかったんだ。簡単なインストール手順も含めているから、ユーザーはこのプラグインを効果的に使うためにコーディングや深層学習の経験が必要ないんだ。

こうした機能を改善することで、医療専門家が医療画像のラベリングをより簡単に行えるようにして、最終的には患者ケアの向上につながることを期待しているよ。

オリジナルソース

タイトル: SAM & SAM 2 in 3D Slicer: SegmentWithSAM Extension for Annotating Medical Images

概要: Creating annotations for 3D medical data is time-consuming and often requires highly specialized expertise. Various tools have been implemented to aid this process. Segment Anything Model 2 (SAM 2) offers a general-purpose prompt-based segmentation algorithm designed to annotate videos. In this paper, we adapt this model to the annotation of 3D medical images and offer our implementation in the form of an extension to the popular annotation software: 3D Slicer. Our extension allows users to place point prompts on 2D slices to generate annotation masks and propagate these annotations across entire volumes in either single-directional or bi-directional manners. Our code is publicly available on https://github.com/mazurowski-lab/SlicerSegmentWithSAM and can be easily installed directly from the Extension Manager of 3D Slicer as well.

著者: Zafer Yildiz, Yuwen Chen, Maciej A. Mazurowski

最終更新: Aug 27, 2024

言語: English

ソースURL: https://arxiv.org/abs/2408.15224

ソースPDF: https://arxiv.org/pdf/2408.15224

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

コンピュータビジョンとパターン認識ニューラルネットワークが画像タイプにどのように適応するか

この記事では、内在次元が画像タイプごとのニューラルネットワークのパフォーマンスにどのように影響するかを調べているよ。

― 1 分で読む

類似の記事