病理学のための機械学習の進展
メラノサイト異型性の診断に機械学習がどう役立つかの紹介。
― 1 分で読む
目次
近年、医学における先進技術の利用が大きく成長してきた特に病理学の分野では、病気を診断するための組織検査が関わっている。そんな進歩の一つが、検査用に準備された組織画像の分析で、特にホルマリンで保存され、パラフィンに埋め込まれたFFPE組織として知られるものだ。歴史的に、この画像の分析は研究目的でのみ受け入れられていたけど、規制機関が特定の画像システムの一次診断での使用を承認した。
病理学における機械学習
人工知能の一形態である機械学習は、病理学を含むさまざまな医療専門分野で人気を博している。昔は、子宮頸部の細胞診スライドの検査用に初めて機械学習デバイスが承認された。しかし、放射線学の分野では、病理学よりもはるかに多くのこうしたデバイスが存在している。それでも、規制当局から承認を受けたデバイスのうち、FFPE組織病理学を分析するために特化したものはほんの一部だ。現在、皮膚組織を分析するための自動システムが著しく不足していて、皮膚病理学者にとっては非常に重要な問題だ。
畳み込みニューラルネットワークとその役割
畳み込みニューラルネットワーク(CNN)は、さまざまな皮膚疾患の特定と診断において期待できる機械学習モデルの一種だ。これらのネットワークは、病理学者がすでにラベルを付けた大量の画像を使用してトレーニングされ、コンピュータがパターンを学び、予測を行えるようになる。しかし、これらのシステムの正確性は画像とそのラベルの質に大きく依存する。一貫性がなかったり不確実なラベル付けがされていると、コンピュータの予測が混乱し、信頼性が下がることがある。
メラノサイト異型性の分析の課題
病理学で特に大きな課題となるのがメラノサイト異型性の特定だ。これは、色素を生成するメラノサイトに見られる異常な特徴を指す。メラノサイト病変には良性の母斑から悪性のメラノーマまでさまざまなタイプがあり、これらの細胞の視覚的特性は正常な皮膚細胞と重なることが多く、診断が難しい。専門の病理学者でも、異型母斑とメラノーマを区別する際に高い不一致を示すことがある。
従来の分類方法
メラノサイト異型性を分類する従来の方法は、かなり複雑な用語を使用することがある。一部の研究室ではこれらの用語を簡略化することがあり、それが異なる解釈や診断の課題を引き起こす原因にもなっている。そのため、より明確で標準化されたアプローチが求められている。
改善された診断ツールの必要性
メラノサイト異型性の診断の複雑さから、病理学者を助けるツールが急務となっている。従来の方法は有用だが、時間がかかり、人為的なエラーの影響を受けることがある。機械学習を使った自動システムは、診断の正確性とスピードを向上させ、患者ケアの改善に寄与する可能性を持っている。
IHC染色の利用
トレーニングのための病理学者は通常、難しいケースで特定の細胞タイプを強調するために特定の染色を使用する。研究者たちは、免疫組織化学的(IHC)染色から得た情報を活用し、組織サンプル内のメラノサイトを自動的にラベル付けする方法を開発している。このアプローチは、IHC染色された断片を対応するヘマトキシリン・エオシン(H&E)染色の断片とペアにして、機械学習モデルのトレーニングで使用されるラベルの正確性を高めることに関わる。
カスタムデータセットの構築
信頼性のあるトレーニングデータセットを開発するために、研究者はメラノーマがあると診断された患者サンプルから画像を収集した。これらのサンプルは全スライド画像(WSI)に処理され、H&EとIHC染色の両方の断片を含んでいた。各ペアは、もう一方のコンテクストを提供し、H&E画像内のメラノサイトを特定するためにCNNのトレーニングを促進する。
画像処理とアラインメント
データセットを準備する際の主な作業の一つは、H&EおよびIHC組織断片をアラインメントすることだ。これにより、一方の画像で行った分析が、他方に正確にマッチすることが保証される。専門のソフトウェアを活用して、高解像度でこれらの画像をアラインメントし、正確なラベル付けの可能性を高める。
トレーニング用のタイルラベリング
トレーニングフェーズでは、CNNにH&E断片から得た画像タイルを提示する。これらのタイルは、対応するIHC断片で確認されたメラノサイトの存在に基づいてラベル付けされる。トレーニング方法は、CNNがメラノサイトに関連する独自の特徴や特性を特定することを学ぶことを保証する。
モデルのトレーニングと評価
CNNは厳格なトレーニングを受け、その性能が継続的に評価され、新しいサンプルでメラノサイトを正確に特定できることを確認する。クロスバリデーションなどの技術を用いて、研究者はさまざまな患者サンプルに対してモデルをテストし、リアルワールドシナリオでの堅牢性を確認する。
モデル性能の分析
トレーニングされたモデルからの結果は有望な性能指標を示し、メラノサイトの存在を予測する高い精度を示している。生成されたヒートマップは、モデルがメラノサイトの活動を予測する領域を視覚的に表し、病理学者がこれらの領域をより簡単にレビューし確認できるようにしている。
モデルの予測を理解する
予測をより解釈しやすくするため、研究者は画像内のどの特定の特徴がモデルの決定に寄与したかを強調する技術を使用している。このステップは、病理学者が自動的な発見を理解し、信頼するのに重要であり、こうした技術を臨床実践に統合するためには不可欠だ。
研究の強みと限界
メラノサイト異型性の分析における機械学習モデルの使用は大きな利点を提供するが、考慮すべき限界もある。研究で使用されたデータセットはアーカイブされたケースに基づいており、サンプルが時間とともにどのように扱われたかによって変動が生じる可能性がある。また、外分泌腺とメラノサイトのような似た外観の構造を区別する際にも課題が残ることがあり、誤分類を引き起こす可能性がある。
今後の方向性
今後は、より多様な例を使ったモデルのトレーニングを強化し、組織サンプルの追加の潜在的な要因を考慮することが、診断の正確性を高めるために重要だ。今後の方向性としては、さまざまな染色方法を統合して、組織とその特徴に対するより包括的な理解を提供することも考えられる。
結論
病理学における機械学習の統合、特にメラノサイト異型性の分析は、診断の実践における重要な進歩を示している。既存のアーカイブデータと先進的な画像技術を活用することで、研究者は病理学者の評価を支援する堅牢なモデルを開発できる。技術が進化し続ける中で、計算モデルと臨床実践の連携が、皮膚疾患の診断や理解を変革する可能性を秘めており、最終的には患者ケアに寄与する。
タイトル: Machine-learning convergent melanocytic morphology despite noisy archival slides
概要: Melanocytic atypia, ranging from benign to malignant, often leads to diagnostic discordance, complicating its prediction by machine learning models. To overcome this, we paired H&E-stained histology images with contiguous or serial sections immunohistochemically (IHC) stained for melanocytic cells via antibodies for MelanA, MelPro, or SOX10. We developed a deep-learning pipeline to identify melanocytic atypia by digitizing a real-world archival dataset of 122 paired whole slide images from 61 confirmed melanoma in situ (MIS) cases at two institutions. Only 37.7% of the cases contained tissue pairs that matched well enough for deep learning. Nonetheless, the MelanA+MelPro models achieved an average area under the receiver-operating characteristic (AUROC) of 0.948 and an average area under the precision-recall curve (AUPRC) of 0.611, while the SOX10 models had an average of 0.867 AUROC and 0.433 AUPRC. Despite learning from biologically different IHC stains, the convolutional neural network (CNN) models independently exhibited an intuitive convergent rationale by explainable AI saliency calculations. Different antibodies, with nuclear versus cytoplasmic staining, provided complementary yet consistent information, which the CNNs integrated effectively. The resulting multi-antibody virtual stains identified morphologic cytologic and small-scale architectural features directly from H&E-stained histology images, which can assist pathologists in assessing cutaneous MIS.
著者: Michael J. Keiser, M. Tada, G. Gaskins, S. Ghandian, N. Mew
最終更新: 2024-09-17 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.12.612732
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.12.612732.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。