Simple Science

最先端の科学をわかりやすく解説

# 電気工学・システム科学# 画像・映像処理# コンピュータビジョンとパターン認識

CycleGANとDCTフィルタリングを使った核検出の改善

新しい方法が合成核画像を強化して、セグメンテーションのパフォーマンスを向上させるよ。

― 1 分で読む


DCTフィルタリングを使っDCTフィルタリングを使ったCycleGANの強化精度が大幅に向上した。新しいアプローチで核のセグメンテーション
目次

顕微鏡画像の核の注釈付けは難しくて、時間がかかることが多いよね。専門的な知識が必要で、ラベリングする人によって結果が異なることもある。この問題は特に蛍光顕微鏡で顕著。CycleGANみたいな生成ネットワークを使えば、与えられたマスクに基づいて合成顕微鏡画像を作成して、トレーニングデータを増やす手助けができる。でも過去の試みでは、マスクと生成された画像との間に不一致があった。これはCycleGANが画像の重要なディテールを隠す傾向があるからなんだ。

この仕事では、CycleGANによって作られた画像を改善する方法を提案するよ。隠れたショートカット、つまりステガノグラフィーを取り除くんだ。離散コサイン変換(DCT)に基づくローパスフィルタリング技術を使う。目的は生成された画像と元のマスクとの整合性を高めること。核のセグメンテーションタスク用の合成データセットをテストしたところ、標準のCycleGANアプローチと比べてパフォーマンスが向上したよ。

顕微鏡画像での核の検出

顕微鏡画像で核や細胞構造を検出するのは、生物医学画像分析では一般的なんだ。いろんな細胞プロセスへの洞察を与えてくれる。深層神経ネットワークを使えばこの検出を自動化できるけど、手動でラベル付けされたデータが大量に必要なんだ。この手動ラベリングは時間がかかるし、核が重なっていたり画像にアーティファクトがあったりするせいで質がバラバラになることも。

教師なし手法も代替手段になり得る。通常、生成モデルがトレーニング用の合成データセットを作成する二段階法と、生成モデルが直接セグメンテーションを行う一段階法の二つのアプローチがある。どちらの方法も、実際の顕微鏡画像と簡単な合成方法で作られたマスクを使って訓練された生成モデルを利用する。

CycleGANはこの文脈でよく使われるアーキテクチャだね。複数のジェネレーターとディスクリミネーターを使って異なる画像ドメインを変換する。サイクル整合性損失によって、画像があるドメインから別のドメインに移るときに内容が保持される。でも、これが必ずしも元の画像と生成された画像の内容が一致することを保証するわけじゃない。

サイクル整合性損失を最小限に抑えようとするために、ジェネレーターは時々入力画像の圧縮版を埋め込むことがある。その結果、重要な内容を転送せずに完璧な再構成を作ることができる。このプロセスはCycleGANステガノグラフィーとして知られていて、ジェネレーターがディスクリミネーターから情報を隠すことで、元の画像と生成された画像の間に不一致が生じるんだ。

DCTフィルタリングの役割

ステガノグラフィーの問題を解決するために、DCTフィルタリングを利用するよ。この技術は、特にJPEG形式の画像圧縮でよく知られている。CycleGANが情報を隠すために使う高周波ピクセルパターンを排除することで、より明瞭で一貫性のある画像を作りたいと思ってる。

生成された画像の高周波係数をゼロに設定する。これによって、画像の実際のディテールをいくつか取り除くことがあるけど、目的にはあまり重要じゃないと考えてる。フィルタリング後も、入力マスクと生成された核画像の間にいくつかの不一致が見られるかもしれないけど、サイクルマスクが生成された画像の内容を正確に反映することを確保するんだ。

フィルタリングされた画像は、核をセグメンテーションするネットワークのトレーニングデータとして使われる。DCTフィルタリングを適用することで精度が向上することを示していて、マスクと生成された画像の関係が改善されるんだ。

合成マスクの作成

合成マスクを作成するために、楕円を使って核の形状をモデル化することができる。効果的だけど、これらの合成マスクを実際の顕微鏡画像に正確に一致させるために慎重な調整が必要だよ。合成と実際の分布の間に大きなギャップがあると、CycleGANはうまく学習できない。

マスクを作成するときは、パラメータをランダムに変えて多様性を確保する。このサイズの軸、偏心率、回転角度のサンプリングを含む。最終的なマスク画像は核が接触するけど、重ならないようにして、現実的な表現を保つんだ。

評価セットアップ

DCTフィルタリングの効果を確認するために、フィルタリングありとなしでCycleGANを使って合成データセットを生成し、文献の他の方法と比較した。トレーニング後、これらの合成画像とマスクを使ってセグメンテーションネットワーク、StarDistをトレーニングした。トレーニングしたセグメンテーションネットワークを実データでテストしてパフォーマンスを評価したよ。

Data Science Bowl(DSB)2018 核データセットとBBBC039v1データセットを使った実験では、提案したCycleGANとDCTフィルタリングが標準CycleGANよりも優れていて、精度スコアが向上し、偽陽性が減少したことがわかった。

画像忠実度の評価

私たちの方法の主な焦点は核セグメンテーションの改善だけど、生成された画像の質も評価したよ。生成データと元の画像をフレシェ距離(FID)で比較したところ、CycleGANとDCTフィルタリングの組み合わせが最高のスコアを出して、画像の忠実度が改善されていることを示した。

合成画像の質的結果

生成された画像をレビューしていると、元の入力マスクとの差異に気づいた。このことは否定的に見えるかもしれないけど、サイクルマスクに変化が反映されている限り、むしろ有益なんだ。提案したDCTフィルタリングは、ステガノグラフィーが効果的に減少したことを示していて、サイクルマスクが生成された画像に密接に一致する結果になった。

対照的に、デノイジングやノイズ注入などの他の方法もステガノグラフィーをある程度減少させたけど、そこまで効果的ではなかった。ノイズ注入から生成された画像は変動が大きく、セグメンテーションタスクの結果が不安定になる傾向があった。

DSBデータセットでのセグメンテーションパフォーマンス

DSBデータセットでテストしたセグメンテーションネットワークは、DCTフィルタリングから生成された合成データセットでトレーニングした際に大幅な改善を示した。私たちのアプローチは標準CycleGANを上回り、より簡単な閾値とより難しい閾値の両方で高い精度を発揮したんだ。

BBBC039v1でのセグメンテーションパフォーマンス

BBBC039v1データセットでは、すべての方法が高い精度を示した。DCTフィルタリング方法が最も良く、他の方法をわずかに上回る結果が出た。BBBC039v1データセットの構造がシンプルで変動が少なかったため、すべてのメトリックでスコアが高くなったよ。

結論

この研究では、CycleGAN生成画像の隠れた情報問題に対処する新しい方法を提案した。私たちのDCTフィルタリングアプローチは、合成画像の一貫性を向上させ、その後のセグメンテーションタスクでのパフォーマンスを改善した。

マスクと生成された画像間の整合性が向上する合成データセットを作成することに注力することで、関与するネットワークの学習プロセスを強化できた。この研究はDCTフィルタリングの効果を示すだけでなく、さまざまなアプリケーションに向けてCycleGANの調整をさらに探求する扉を開くものでもあるんだ。

今後の研究では、CycleGANのセグメンテーション能力を向上させるための追加的な方法を探ることができる。これは、後処理に依存せずにインスタンスマスクを直接生成するようにアーキテクチャを適応させる可能性を含む。他の類似のタスクに対してステガノグラフィー除去アプローチを適用することで、生成ネットワークの分野により広い影響を与えられるかもしれないよ。

オリジナルソース

タイトル: Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN

概要: Annotating nuclei in microscopy images for the training of neural networks is a laborious task that requires expert knowledge and suffers from inter- and intra-rater variability, especially in fluorescence microscopy. Generative networks such as CycleGAN can inverse the process and generate synthetic microscopy images for a given mask, thereby building a synthetic dataset. However, past works report content inconsistencies between the mask and generated image, partially due to CycleGAN minimizing its loss by hiding shortcut information for the image reconstruction in high frequencies rather than encoding the desired image content and learning the target task. In this work, we propose to remove the hidden shortcut information, called steganography, from generated images by employing a low pass filtering based on the DCT. We show that this increases coherence between generated images and cycled masks and evaluate synthetic datasets on a downstream nuclei segmentation task. Here we achieve an improvement of 5.4 percentage points in the F1-score compared to a vanilla CycleGAN. Integrating advanced regularization techniques into the CycleGAN architecture may help mitigate steganography-related issues and produce more accurate synthetic datasets for nuclei segmentation.

著者: Jonas Utz, Tobias Weise, Maja Schlereth, Fabian Wagner, Mareike Thies, Mingxuan Gu, Stefan Uderhardt, Katharina Breininger

最終更新: 2023-08-03 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2308.01769

ソースPDF: https://arxiv.org/pdf/2308.01769

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事