機械学習で目の健康を進める
この研究は、ブラジルの画像データを使って網膜疾患を特定するモデルを開発してるよ。
― 1 分で読む
医療画像はどんどん進化していて、医者が理解する必要があるデータがたくさん生まれてるよ。でも、画像を解釈できる訓練を受けた専門家が足りないから、患者の診断や治療が遅れることがあるんだ。機械学習や人工知能は医療をもっと良く、早く、安くできる道具で、特に目の健康に役立つんだ。
眼科では、病気を特定したり監視するためにいろんな種類の画像を集めてるよ。網膜の写真や光干渉断層計っていうのも含まれてるけど、こういう imaging のツールは普及してるのに、画像を解釈して患者を適切なケアに導く専門家がまだまだ不足してる。特に深刻な目の病気が増えてきてるから、この問題はますます緊急になってきてるんだ。
リソースが豊富な国は、プロフェッショナルや技術も多いから、たくさんの imaging データを管理しやすい。でも、中低所得国はこの専門知識が不足してるから、眼科ケアの格差が生まれちゃう。実際、ほとんどの眼科医は数カ国にしかいなくて、多くの地域では専門家へのアクセスが限られてるんだ。
機械学習モデルを訓練するためのデータはほとんど裕福な国から来てるから、さまざまな人々のデータや目の病気を反映できてないかもしれない。それが別の環境でこのモデルを適用する時に問題を引き起こすかもしれないんだ。
網膜の画像診断は、目の病気を診断するのにコスト効果が高い方法なんだ。AIをこのプロセスに組み込むことは期待されていて、特定の条件を見つけるプロジェクトがいくつかあるんだ。この研究では、ブラジルで集めた画像から自動的に網膜の病気を特定できるモデルを開発してるよ。ここはあんまり研究されてない地域だからね。
方法
ブラジルの「ブラジル多ラベル眼科データセット」っていうデータセットを使ったんだ。これは、数千人の患者から集めた1万6000枚以上の画像が含まれてる。画像はブラジルの3つの眼科センターから集めたもので、各患者からはマクーラに焦点を当てた1枚だけを選んだ。画像は特定のカメラで訓練されたスタッフによって撮影されたよ。
データセットを準備する時は、画像から個人情報やセンシティブな情報を取り除いたし、目の関連部分に焦点を当てていない画像は除外した。明確に特定の網膜の特徴が見える画像だけを残したんだ。これで、データセットが一貫していて、モデルの訓練に役立つようにしたよ。
画像と一緒に、患者の年齢や病歴などの基本情報も集めたけど、モデルの訓練にはこの追加情報を使わないことにした。画像だけでどれだけモデルがうまくいくか見たかったからね。
データセットには、画像の質がいろいろある。各画像は焦点、クリアさ、その他の要素に基づいて満足または不満足に評価されたよ。不満足な画像もあったけど、実際のシナリオに適応できるモデルにするために訓練に含めたんだ。
各画像は、眼科医がいろんな条件を特定してラベル付けした。ラベル付けのプロセスは正確さを確保するために慎重に行われたよ。データセット内で各条件がどれだけ出現したかをまとめたんだ。
モデル開発
画像を処理するためにサイズを統一したよ。訓練中は、画像のバラエティを人工的に増やすいろんなテクニックを使った。例えば、回転させたり反転させたりね。これで、同じ画像の違う視点を見せることで、モデルがより良く学習できるんだ。
データセットは健康な目の画像と病気の画像の数に大きな不均衡があったから、これに対処するためにいろんな方法を試した。大部分のクラスをアンダーサンプリングしてバランスを取ることもしたよ。
特別な種類のニューラルネットワーク、つまり畳み込みニューラルネットワーク(CNN)を使った深層学習技術に頼った。画像データを扱うのに効果的なResNet-50モデルを選んだんだ。このモデルは、画像から重要な特徴を学ぶのに役立ついくつもの層があるよ。
モデルの訓練のために、画像を訓練、検証、テスト用に60-20-20に分けた。モデルの出力に基づいて病気を予測するための最適な閾値を決めるプロセスを使ったんだ。
さらに、同じタイプのカメラで訓練した画像を使って、別のカメラの画像でテストした時にモデルがどれだけ機能するかも確認した。これで、モデルが異なるデータソースにどれだけ適応できるか理解できたんだ。
結果
いろんな訓練を経て、モデルの最良のパラメーターを確立した。いくつかの目の状態を特定するのに強いパフォーマンスを示したよ。データセット内で画像が多かった状態、例えば糖尿病網膜症や黄斑浮腫なんかは、モデルが特定するのが特に楽だった。
逆に、条件によってはモデルが捉えにくかったものもあった。主にデータセットに少ないインスタンスしかなかったからね。網膜剥離みたいな病気は画像がほんの数枚しかなかったから、特定結果が悪かったんだ。
「その他」カテゴリの画像に関しては、いろんな病気が含まれてたから、モデルが混乱しちゃってたのかも。将来的には、これらの画像をもっと具体的な条件でラベル付けすることが、モデルの正確さを改善するのに役立つかもしれないね。
データセットの不均衡に対処するために、いくつかの実験を行った。あるケースでは、健康な画像をたくさん削除してモデルのパフォーマンスが改善するか試したけど、ちょっとだけ良くなったよ。
あまり頻繁に見られない条件をまとめて「その他」カテゴリにすることも試みたけど、このアプローチではパフォーマンスの意味のある改善にはつながらなかったんだ。
最後に、異なるモデルの出力を組み合わせるアンサンブル法を使って正確さを高めるか試したけど、小さな向上が見られたものの、追加の複雑さが医療現場での利益を正当化するかは微妙だったな。
結論
この研究は、ブラジルで集めた画像を使ってさまざまな網膜の病気を特定するモデルを開発することを目指してた。正しいテクニックを使ったResNet-50モデルが、これらの病気を効果的に分類できることを示したよ。私たちの研究は、特に訓練を受けた専門家が不足している場所での眼科ケアにおけるAIツールの可能性を強調してる。
モデルのパフォーマンスは、訓練データにどれだけの各病気の例があるかで変わることが分かった。全体として、モデルは一般的な状態ではよく機能するけど、より珍しい状態では苦労するんだ。
将来は、この基礎的なモデルをもとに、もっと複雑なモデルを試したり、異なるデータセットを利用することで、さらに効果的な目の病気の診断ツールを開発する可能性があるよ。こういう進展があれば、ケアへのアクセスを改善して、患者の結果を向上させることにつながるかも。
私たちのモデルを他の病気に訓練されたモデルと組み合わせることで、より強力な診断ツールが生まれるかもしれない。これは、迅速なスクリーニングと治療が重要なリソース不足の環境では特に有益だろうね。この取り組みを続けることで、世界中の目の健康の向上に貢献できることを願ってるよ。
タイトル: Deep Learning for Multi-Label Disease Classification of Retinal Images: Insights from Brazilian Data for AI Development in Lower-Middle Income Countries
概要: Retinal fundus imaging is a powerful tool for disease screening and diagnosis in opthalmology. With the advent of machine learning and artificial intelligence, in particular modern computer vision classification algorithms, there is broad scope for technology to improve accuracy, increase accessibility and reduce cost in these processes. In this paper we present the first deep learning model trained on the first Brazilian multi-label opthalmological datatset. We train a multi-label classifier using over 16,000 clinically-labelled fundus images. Across a range of 13 retinal diseases, we obtain frequency-weighted AUC and F1 scores of 0.92 and 0.70 respectively. Our work establishes a baseline model on this new dataset and furthermore demonstrates the applicability and power of artificial intelligence approaches to retinal fundus disease diagnosis in under-represented populations.
著者: Dewi S.W. Gould, J. Yang, D. A. Clifton
最終更新: 2024-02-13 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。