スタック型転移学習で病気リスク予測を改善する
新しい方法が既存のモデルを使って心臓病のリスク予測を強化するんだ。
― 1 分で読む
目次
医療分野では、病気のリスクを予測するのが重要なんだ。これによって、将来深刻な健康問題を抱えるかもしれない患者に対して、医者が治療を調整できるようになるんだ。心臓関連の病気、例えば心臓発作や脳卒中に関しては、専門の組織が治療が必要な患者を特定するための具体的な方法を推奨しているよ。これらの方法はリスク予測モデルと呼ばれているんだ。
イギリスでは、QRISK2とQRISK3という2つの人気のリスク予測ツールがある。これらは、10年以内に心臓病になるリスクが10%以上の人を特定するのに役立つんだ。このカテゴリーに入る人には、医者が治療を勧めることがあるよ。
地元のパフォーマンスの重要性
これらのモデルを地元の病院やクリニックで使うのはめっちゃ重要なんだ。もし特定の地域でモデルがうまく機能しないと、問題が起こることがある。例えば、実際にはリスクが低い人が必要以上に治療を受けたり、リスクが高い人がタイムリーにケアを受けられなかったりすることがあるんだ。QRISK3を含むいくつかのモデルは他の環境でテストされているけど、ローカルで適用したときにはパフォーマンスが異なるかもしれないんだ。研究によると、これらのモデルの効果は場所によって大きく異なることがあるんだよ。
SCORE2というモデルは、多くのヨーロッパの国でテストされていて、心臓関連のイベントを予測する精度が異なることがわかったんだ。例えば、イタリアでの方がロシアよりも正確だったんだ。この違いから、特定の地域でモデルがどれだけうまく機能するかを確認する必要があるってことがわかるよ。
モデルの再キャリブレーション
リスク予測モデルをローカルで使う前に、そのパフォーマンスを確認するのが大事なんだ。もしモデルがうまく機能しなければ、精度を向上させるために調整が必要になることがある。モデルを改善する簡単な方法の一つは、再キャリブレーションなんだ。これは、いくつかのパラメータを調整して、予測が実際のリスクにより合致するようにすることを含むよ。
場合によっては、地元の人々に関連する追加の要素を含めるような、もう少し複雑な調整が必要になることもあるんだ。ただし、これらの複雑な変更に必要なデータを集めるのは、特に大きな病院でも難しいことがあるんだ。
新しい方法:スタック転送学習
従来のモデルの限界に対処するために、研究者たちはスタック転送学習という方法を提案しているんだ。このアプローチは、複数の既存のモデルを組み合わせて、ローカルのニーズにより適した新しいモデルを作るってものなんだ。要するに、ゼロから始めるのではなく、以前に開発されてテストされたモデルを活用するってことだね。そうすることで、医療提供者は少ないデータでより良い予測ができるようになるんだ。
例えば、心臓病リスクを予測する研究では、既に作られた複数のモデルを見ていたんだ。彼らはスタッキングという技術を使って、いくつかのモデルの予測を組み合わせたんだ。これによって、大規模なデータセットなしで、より正確な予測ができるようになるんだ。
実際の例
ある研究では、イギリスの大規模な健康データベースのデータを使ったんだ。彼らは、過去に心臓の問題がなかった人々の心臓病の10年リスクを予測することを目指していたんだ。また、2型糖尿病や慢性腎疾患のリスクもチェックしたんだ。チームは、参加者から年齢、性別、体重、コレステロール値、血圧、医療歴などの関連情報を集めたよ。
この研究では、スタックモデルのパフォーマンスを、個々の既存モデルと比較したんだ。これらのモデルを組み合わせることで、心臓病イベントを予測する能力が、どの単一モデルよりも良かったんだ。スタックモデルはキャリブレーションも改善されて、様々なサンプルサイズでの予測が実際のリスクにより近くなったんだ。
サンプルサイズ間のパフォーマンス
実際の医療の現場では、大規模な患者集団を達成するのはしばしば難しいんだ。だから、研究者たちは小さなサンプルサイズでモデルのパフォーマンスをテストしたんだ。限られたデータでも、スタックモデルは心臓病リスクを予測するのにうまく機能したんだ。他のモデルと比較したときも、スタックアプローチは様々なグループサイズに対して一貫してより良い推定を提供したんだよ。
他の病気に対する結果
研究者たちは、この方法が2型糖尿病や慢性腎疾患のリスクを予測するのにどう役立つかも調べたんだ。心臓病の結果と似たように、スタックモデルは少ない症例でも高いパフォーマンスを示したんだ。
スタック転送学習が重要な理由
スタック転送学習のアプローチは、大規模なデータセットにアクセスできない医療現場にとって現実的な解決策を提供するんだ。複数の確立されたモデルを組み合わせることで、医療専門家は地域の人口に合わせた予測ができ、意思決定を改善できるんだ。
医療が進化する中で、スタック転送学習のようなツールを使えば、リスクを効果的に予測し、患者ケアを管理する能力が向上するかもしれないんだ。この方法は、医療従事者がより情報に基づいた決定を下せるようにするから、最終的には患者の結果も改善されるよ。
限界と今後の方向性
スタック転送学習は可能性があるけど、課題も残ってるんだ。特定の集団から得たデータを使った研究結果が、他の場所で必ずしも適用できるわけじゃないこともあるから、研究者たちは様々な環境でこれらのモデルをテストして改善し続ける必要があるんだ。
今後の研究では、この方法を他の病気や状態に適用することが期待されていて、医療での使用を拡大することができるかもしれないんだ。研究者たちは、スタック転送学習の効果を示すことで、より多くの医療機関がこのアプローチを採用して患者ケアを最適化してくれることを望んでいるんだ。
結論
リスク予測モデルは、深刻な病気のリスクがある患者を特定するのに重要な役割を果たしているんだ。これらのモデルを地域の人口に合わせて調整することで、治療の結果が改善されるんだ。スタック転送学習という革新的な方法は大きな可能性があって、医療提供者が既存のモデルを組み合わせて、広範なデータなしでもより良い予測を行えるようにするんだ。
医療の状況が変わる中で、こういった方法があると、患者が正確なリスク評価に基づいてタイムリーで適切なケアを受けられるようにするのに役立つんだ。こうしたモデルの開発と検証を続けることが、臨床現場でのリスク予測の効果を高めるために重要なんだよ。
タイトル: Stacking multiple prediction models to optimise performance in local settings: exemplars in cardiometabolic disease
概要: BackgroundRisk prediction models are used in healthcare settings to tailor therapies to individuals most likely to benefit. Despite appropriate external validation, difference in local characteristics (e.g. patient mix) may attenuate model performance. Prior to any implementation it is therefore advisable to explore local performance, typically requiring a modest amount of historic data. Depending on model performance, model adjustments might be necessary which often require large amounts of data. Here we explore a small sample size approach approximating de novo derivation, by combining model stacking and transfer learning, referred to as stacked transfer learning. As an example we focus on stacking previously trained risk prediction models for cardiovascular disease (CVD), stroke, (chronic) kidney disease, and diabetes. MethodsWe leverage data from the UK biobank to illustrate the benefits of stacking previously trained risk prediction models, predicting the risk of incident CVD, chronic kidney disease (CKD) or diabetes. To mimic sample sizes available in local settings, such as a small to large healthcare trust, we iterated the number of training cases between 10 and 1000. Model stacking was performed using a LASSO penalized logistic regression model, and compared performance of a de novo model estimating the local association of 33 variables used in the aforementioned risk prediction models. ResultsWe found that stacked models require roughly one-tenths of the training sample size compared to de novo derivation of a prediction model. For example, predicting CVD the stacked model required 30 cases to reach a area under the curve (AUC) value (with 95% CI) of 0.732 (0.728, 0.735), while the de novo model required 300 cases to reach approximately the same performance. As expected, the absolute performance depended on the predicted outcome, where for example the difference between de novo and stacked modelling was smaller for CKD prediction. ConclusionWe show that our proposed "stacked transfer learning" approach closely approximated the predictive performance of a de novo model, often requiring only a fraction of the data. As such, this approach should be considered when tailoring a model to a local setting.
著者: Sreejita Ghosh, J. Gratton, R. C. H. Vermeulen, F. W. Asselbergs, J. J. Vlaanderen, A. F. Schmidt
最終更新: 2023-06-20 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2023.06.16.23291489
ソースPDF: https://www.medrxiv.org/content/10.1101/2023.06.16.23291489.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。