Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療情報学

機械学習を使ってSSc-ILD患者の肺機能の変化を予測する

この研究では、機械学習がSSc-ILDにおける肺機能の変化をどう予測できるかを探ってるよ。

― 1 分で読む


肺疾患における機械学習肺疾患における機械学習予測モデル。SSc-ILD患者の肺機能に関する高度な
目次

全身性硬化症(SSc)は、免疫システムに影響を及ぼし、血管を傷つける長期的な病気だよ。これが原因で体のいろんな臓器や組織の働きが変わることがあるんだ。その中で、SScから発生する深刻な問題の一つが間質性肺疾患(ILD)っていう状態。ILDは、肺にスカー組織がたくさんできちゃって、患者が呼吸しづらくなるんだ。これが進行すると、時間と共に悪化して、SScの人たちが病院に行く理由や亡くなる原因になりがちなんだ。

だから、ILDはSScの人にとって大きな問題だから、定期的なチェックアップがめちゃ大事。医者は肺の機能をしっかりモニタリングして、早めに変化を見つけるようにしてるよ。このプロセスは、通常、肺の詳細な画像を撮ったり、肺の機能を評価するテストを行うことを含むんだ。

現在の肺疾患モニタリング方法

今は、医者は胸の高解像度コンピュータ断層撮影(HRCT)スキャンを使って、肺がどれぐらい影響を受けているかを見ているよ。それに、肺の健康を評価するための肺機能テスト(PFT)も行ってる。新しく開発されたHRCTスキャンから得た情報を分析する方法は、SSc-ILDの患者が深刻な健康問題なしにどれぐらい生きられるかを予測するのに役立つ可能性があるってわかったんだ。

他の研究では、強制肺活量FVC)や肺がガスを移動させる能力(DLCO)などの特定の測定値が、個々の患者におけるILDの進行状況を示すかもしれないって言われてるよ。でも、患者はそれぞれ違うし、病気が進行する速度が早い人もいれば遅い人もいるから、合併症のリスクが高くなることもあるんだ。各患者の肺機能が時間と共にどう変化するかを理解することは、最適なケアを提供するためにめっちゃ重要なんだ。

疾患進行予測の進歩

研究者たちは、SSc-ILDがどう進行するかを予測するのに役立つサインやマーカーを探しているんだ。いくつかの研究で、病気の進行を予測するのに役立ついくつかの潜在的なマーカーが特定されたよ。たとえば、ある研究者は、患者がどれだけ歩くかや特定の関節の問題があるかに基づいて予測モデルを開発したり、他の研究では性別や以前にアスピリンを服用していないことが、病気の進行と関連があるかもしれないって見つけたりしてる。

でも、こうした進展があっても、IL中の進行を個々のレベルで予測する確実な方法はまだないんだ。患者がどれぐらいの頻度でスクリーニングされるべきかや、最適な方法についても合意がない状態なんだ。

さまざまな発見は、研究された患者群の違いによるものかもしれないし、また、これらの研究の多くは、データの複雑さを捉えきれない標準的な分析技術を用いていた可能性もあるんだ。技術が進歩する中で、機械学習ML)が強力なツールとして浮上してきたよ。これは、大きなデータセットから有用な情報を抽出するのに役立ち、患者ケアについてより良い洞察を提供できるんだ。

機械学習の助けになること

機械学習の方法は、複雑な情報を分析して意思決定を助けることができるよ。たとえば、研究者たちは、遺伝子データや画像データを分析することで目の病気の進行を予測するためにMLを使ったり、血管内のプラークの進行を評価することで心臓病のリスクがある患者を特定したりしてる。同様の方法をSSc-ILDに応用して、肺機能の変化を予測することができるんだ。

私たちの貢献

今回の研究では、機械学習を使ってSSc-ILD患者の将来の肺機能値を予測することに注力したよ。各患者のタイムラインを作成して、訪問時の情報を集め、イベントの順序を保っているんだ。私たちはいくつかの主要な目的に取り組むことにしたんだ:

  1. SSc-ILD患者の肺機能の変化を理解するために特化した新しいモデルを開発する。
  2. 新しいモデルをさまざまな標準的なMLモデルと比較して、その精度を評価する。
  3. 特定の要因が予測の精度にどう影響するかを分析する。
  4. 予測の不確実性を改善する方法をテストする。
  5. モデルの予測に大きな役割を果たす特徴を特定する。

患者からのデータ収集

私たちは、数千人の患者の情報を含む大規模なデータベースを使用したよ。このデータベースには、健康状態、人口統計、複数回の訪問にわたる臨床データの詳細が含まれている。分析のために、特定の基準を満たす患者、つまり画像検査で確認されたILDと診断された成人で、肺機能測定が記録されていて、クリニックへの複数回の訪問歴がある患者を含めたんだ。

患者の軌跡の理解

収集したデータを患者のタイムラインに整理して、各患者の状態が時間とともにどう進化したかを把握できるようにしたよ。各訪問は、患者の健康や肺の機能のより明確な画像に寄与したんだ。過去の訪問を使って、将来の肺機能の結果を予測することを目指しているんだ。

患者の特性の分析

最終的な研究グループは、2000人以上の患者で構成されていて、そのほとんどは女性で、平均年齢は約53歳だったよ。データは、年齢や性別、喫煙習慣などのさまざまな特性を示していて、これが各患者の健康状態を理解するためのさらなる文脈を提供してくれたんだ。

疾患進行モデル

タイムラインデータを使って、以前の訪問に基づいて患者の将来の結果を予測することに焦点を当てたよ。いろんなモデリング技術を使ったんだ:

  • リカレントニューラルネットワーク(RNN):このモデルは、患者のタイムラインみたいな連続データの処理に優れているよ。
  • トランスフォーマーネットワーク:さまざまな要因の重要性を予測に反映させることができる先進的なモデル。
  • アテンティブニューラルプロセス(ANP):このモデルは、データから効率的に学んで予測の不確実性を提供するように設計されているんだ。

予測の精度測定

私たちは、モデルの精度を評価するためにいろんな方法を使ったよ。主要な指標の一つは、二乗平均平方根誤差RMSE)で、これを用いて実際の結果と予測がどれほど近いかを測ったんだ。また、さまざまな要因が予測にどう影響したかも評価したよ。

予測における不確実性

予測が必ずしも正確でないことを理解しているから、私たちはモデルがどうやって不確実性の推定を提供できるかを見たんだ。たとえば、実際の肺機能が特定の予測範囲に収まる可能性がどれぐらいかを評価したよ。この不確実性の推定は、医者が患者ケアについて情報に基づいた意思決定をするのに重要なんだ。

予測における特徴の重要性

私たちは、どの特徴が予測に最も影響を与えるかを分析したよ。この分析では、以前の肺機能測定や皮膚の関与の程度、年齢、特定の臨床的な詳細が重要な役割を果たすことが分かったんだ。これらの洞察は、クリニシャンが患者の監視を行う際に注意すべき要因を理解するのに役立つよ。

治療記録の重要性

一つの注目すべき発見は、正確な治療記録の重要性だった。治療の記録が増えるにつれて、モデルの予測が改善されることが見られたよ。これは、将来より効果的な予測モデルを訓練するための徹底した記録保持の必要性を強調しているんだ。

結論

私たちの研究は、SSc-ILD患者の肺機能の変化を予測するために高度な機械学習技術を使う可能性を示しているよ。結果は、逐次モデルが標準的な方法よりも優れており、患者の軌道に関する正確な洞察を提供しているってことを示しているんだ。このアプローチは、病気の進行を理解するだけでなく、医療提供者が患者をより効果的に管理し治療するための貴重なツールを提供するんだ。将来の健康結果を正確に予測することで、患者ケアにおいてより情報に基づいた意思決定ができるようになり、最終的にはSSc-ILDを抱える人々の生活の質を向上させる助けになるんだ。

オリジナルソース

タイトル: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study

概要: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.

著者: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators

最終更新: 2024-04-26 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365

ソースPDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事