Simple Science

最先端の科学をわかりやすく解説

# 生物学# システム生物学

細胞セグメンテーション技術の進歩

新しい方法で、追加のラベリングなしに未知の細胞タイプのセグメンテーションが改善されたよ。

― 1 分で読む


改良された細胞セグメンテー改良された細胞セグメンテーション手法上する。新しい技術で未訓練の細胞タイプの精度が向
目次

最近の顕微鏡技術の進展により、細胞の顕微鏡画像を大量にキャプチャすることができるようになった。これはライフサイエンスにとってすごく重要で、この膨大なデータから有用な情報を分析して抽出する方法を作る必要がある。分析の中で重要なプロセスは細胞セグメンテーションで、これには画像内の異なる細胞領域を特定して輪郭を描くことが含まれる。これは、細胞の形状や特徴を測定して生物学的プロセスについての洞察を得るために必要不可欠だ。

従来の細胞セグメンテーションの方法はさまざまな画像処理技術に依存してるけど、これらはしばしば各画像ごとに特定の設定が必要で、結果が悪くなったり処理が遅くなったりすることがある。最近、ディープラーニングを利用した新しいアプローチが登場した。これらの方法は設定を自動で調整できるから、効率と精度の両方が向上する。畳み込みニューラルネットワーク(CNN)などのディープラーニングモデルは、画像のどの部分が細胞でどの部分が細胞でないかを認識するように訓練される。

細胞セグメンテーションの課題

しかし、これらのディープラーニングモデルには課題もある。よくある問題は、これらのモデルがあるタイプの細胞で訓練されてから、異なる未知の細胞タイプで使用されると性能が大幅に低下することだ。新しい細胞タイプの特徴を認識するのが難しいからだ。簡単な解決策は、それぞれの未知の細胞タイプのために新しいラベル付きデータセットを作成することだが、これは時間がかかり、すべてのピクセルに詳細なラベリングが必要なので高くつく。

ディープラーニングにおける前提は、訓練とテストに使用されるデータが似ていることだ。もしそれらの違いが大きすぎると、モデルの性能が落ちる。この状況はドメインシフトとして知られている。この問題に対処するために、新しいラベル付き画像を必要としないいくつかの方法が開発されている。これらの方法は、モデルを新しいデータの特性により良く適応させる。

細胞セグメンテーションの新しい方法

私たちの研究では、追加のラベル付きデータなしで細胞セグメンテーションを改善する新しい方法を紹介した。私たちのアプローチは、ピクセルレベルでの違いに調整しながら一緒に学習する2つの異なるエンコーダ・デコーダモデルを使用する。つまり、一方のモデルが細胞領域を予測している間、もう一方のモデルはその予測を利用して自分の理解を改善し、逆もまた然り。

私たちはこの方法を、人間とマウスのいくつかの細胞タイプの位相差画像を含むパブリックデータセットでテストした。結果は、私たちの方法が未知の細胞タイプのセグメンテーション精度を大幅に改善したことを示した。場合によっては、ラベル付きデータの訓練を必要とする従来の教師あり学習モデルを上回る結果も出た。

データセットと分析

実験には、さまざまな細胞タイプを含む特定のデータセットを利用した。画像は異なる細胞の形態を代表するよう慎重に選ばれた。モデルが効果的に学べるように、ラベルエラーや非常に混雑した細胞画像を含むデータは除外された。また、特定の画像パターンからのバイアスを避けるために、訓練およびテストデータセットを整理した。

使用した画像は一貫性を保つように処理され、モデルの訓練を強化するためにさまざまな拡張技術が適用された。これには、画像を反転させたりトリミングしたりすることが含まれ、モデルが異なる位置や向きの細胞を認識する学習を助ける。

提案された方法の概要

私たちの提案した方法、CULPICOは、互いにインタラクションしながら学習を改善する2つのエンコーダ・デコーダモデルで構成されている。それぞれのモデルは、細胞がどこにあるかを予測するために画像を処理する。一方のモデルによる予測がもう一方のモデルのガイドとなり、両方が共有された理解に基づいて予測を洗練させることができる。

訓練は、ラベルが付けられたデータでの教師あり学習と、ラベルが付けられていないデータでの協調的自己学習の2つの主要な部分から成る。教師あり訓練では、モデルは細胞の位置を示すラベル付き画像から学ぶ。自己学習フェーズでは、モデルはラベルなしの画像で予測を利用して改善を図る。

方法の評価

私たちの方法を評価するために、ラベル付きデータセットとラベルなしデータセットのみで訓練された下限モデルと上限モデルの性能を比較した。結果は、私たちの方法が下限モデルを大幅に上回り、特に以前に課題とされていた細胞タイプの組み合わせで優れた結果を示した。

また、細胞の形態的特徴を分析するためにデータを視覚化した。これは、より良い視覚化のために画像データの複雑さを2次元に減少させることを含んでいた。この分析を通じて、画像が細胞タイプごとにクラスタリングされていることを確認し、明確な区別があることが示された。

結果と性能の比較

私たちの提案した方法の性能は、さまざまな細胞タイプの組み合わせでの広範なテストを通じてさらに検証された。セグメンテーションのパフォーマンスを正確に測定するための指標も計算し、特にモデルが背景スペースを誤ってラベル付けすることなく、真の細胞領域をどれだけよく識別できるかに焦点を当てた。

私たちの発見は、CULPICO方法が多くの未知の細胞タイプに対して堅牢に性能を向上させ、特定のケースでは従来の教師ありモデルに匹敵するかそれ以上の能力を示したことを示している。この方法は予測能力をうまく洗練し、特に偽陰性を減少させることに成功した。

モデル要因の分析

さらなる分析により、セグメンテーションの顕著な改善は、私たちの方法が細胞領域の予測を更新する方法に起因していることが明らかになった。モデルは、予測されたラベル間のピクセルレベルの違いに基づいて動的に出力を調整することができた。この相乗効果により、継続的な学習が可能になり、訓練中にエラーが徐々に減少した。

セグメンテーション結果の視覚的評価は、いくつかの細胞タイプの組み合わせで意味のある改善を反映していた。特に、互いに情報を提供する特徴を持つ特定の細胞タイプと組み合わせた場合、モデルが非常に良い結果を示すことに気づいた。

結論

要するに、私たちの教師なしドメイン適応法は、追加のラベリングなしで未経験の細胞タイプのセグメンテーションを効果的に改善する。CULPICOアプローチは、新しい細胞画像に適応するという課題に応えるだけでなく、ライフサイエンス研究におけるより広い応用の可能性も示している。協調的自己学習を採用することにより、この方法は生物学的知識の抽出速度を大幅に加速させることができ、分野でのさらなる発見の道を開くことが期待できる。

オリジナルソース

タイトル: Cell segmentation without annotation by unsupervised domain adaptation based on cooperative self-learning

概要: Cell segmentation, which extracts cells from microscopic images, is essential for quantitative evaluation of cell morphology. Recently, supervised deep-learning-based models have been shown to achieve highly accurate segmentation. However, the performance of these supervised models is often degraded when the models infer unknown cell types that are not included in the train dataset. One approach to overcoming the performance degradation is acquiring new annotated data for each cell type. However, constructing datasets for all cell types is not feasible because labeling every single pixel, rather than each image, is required in the segmentation task. Learning methods that can achieve highly accurate segmentation without annotation is strongly required. Here, we developed a cell segmentation method based on unsupervised domain adaptation with cooperative self-learning (CULPICO: Cooperative Unsupervised Learning for PIxel-wise COloring). The proposed method consists of two independent segmentation models and a mutual exchange mechanism of inference data. For the data with labels, the models are trained through supervised learning. For the data without labels, the models infer a label probability at each pixel and generate a pseudo-label as unsupervised learning. The pseudo-labels created by each model are mutually used as ground-truth in the other model. Loss function is corrected by considering pixel-level discrepancies between the label probabilities inferred by the two models. The proposed method, despite being an unsupervised learning method, can segment the unknown cell types without labels with an accuracy comparable to supervised learning models. Our method, which could solve the performance degradation problem without constructing new datasets, is expected to accelerate life science by reducing the cost of extracting quantitative biological knowledge.

著者: Akira Funahashi, S. Miyaki, S. Nishimoto, Y. Tokuoka, T. G. Yamada, T. Morikura

最終更新: 2024-07-09 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.07.05.602197

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.07.05.602197.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事

人工知能機械学習と制約プログラミングを組み合わせたジョブスケジューリング

新しい方法がディープラーニングと制約プログラミングを組み合わせて、ジョブスケジューリングを改善してる。

― 1 分で読む