医療における予測モデルの台頭
患者ケアにおける予測モデルの成長と課題を調査中。
Lara Lusa, F. Kappenberg, G. S. Collins, M. Schmid, W. Sauerbrei, J. Rahnenfuehrer
― 1 分で読む
目次
予測モデルは医療分野で重要な役割を果たしてて、医者が患者の結果を色んな要因に基づいて予測するのを助けるんだ。これらのモデルは、病気の診断、病気の進行の予測、そして患者に最適な治療法の選択にも役立つよ。
臨床予測モデルって何?
臨床予測モデルは、患者に関する具体的なデータを使って、様々な健康結果のリスクを推定するんだ。このデータには、年齢や性別といった人口統計的な詳細や、医療履歴、テスト結果が含まれることがあるよ。
こういうモデルへの関心は、医療コミュニティの中でどんどん高まってきてる。最近では、これらの予測モデルを開発することに焦点を当てた研究が急増してるんだ。例えば、医学データベースを調べてみると、20年前に比べてこのテーマに関する出版された研究が2倍以上になってる。
予測モデルを使う上での課題
多くの研究や関心が高まっているにもかかわらず、実際の臨床現場ではこれらの予測モデルはほとんど使われてない。これにはいくつかの要因があるんだ。大きな懸念の一つは、予測モデルの多くが確立されたガイドラインに従って開発されていないこと。研究によると、多くのモデルは開発のベストプラクティスを満たしていないということがわかってる。
もう一つの課題は、これらのモデルを作成するために機械学習などの複雑な方法への依存が高まっていること。機械学習は大規模なデータセットを迅速に分析できるけど、これらの方法は理解が難しいことが多く、正しく検証されないと不正確な結果を招くことがあるんだ。結果の透明性が欠けると、医療従事者がこれらのモデルを信頼して適用するのが難しくなる。
さらに、データの質も広範囲で異なることが多い。多くのデータセットには、意味のある洞察を提供するために必要な詳細や正確さが欠けてる。よくある問題には、データの欠損、地域ごとの異なる医療慣行、患者の人口構成の不均衡などがあるよ。
新しいガイドラインの必要性
予測モデルが機械学習のような高度な技術を使うことでますます複雑になる中、従来の開発や報告に関する推奨事項はしばしば不十分なんだ。機械学習や人工知能を利用するモデル向けに特に調整された新しいガイドラインを作成するための取り組みが進んでいるよ。
これらのガイドラインは、予測モデルの設計、報告、批判的評価を改善することを目指している。注目すべき取り組みには、モデルの開発と検証のためのガイドライン、人工知能を利用した試験の実施方法、機械学習モデルにおけるバイアスのリスク評価が含まれるよ。
現在の予測モデルの状況を分析する
予測モデリングの分野がどのように進化しているかを理解するために、既存の研究とその結果を要約した様々な系統的レビューを見てみることができるよ。これらのレビューは、予測モデルの開発、パフォーマンス、質のトレンドを浮き彫りにするのを助ける。
最近数年、予後モデルに関する系統的レビューの数も増えてきた。これらのレビューは、特定の病気や患者グループに焦点を当てることが多いけど、広範な研究を含むものもあるんだ。
これらのレビューを分析すると、より多くの研究が行われている一方で、多くが古い慣行に従っていることが明らかになる。報告方法やガイドラインへの遵守にいくつかの改善が見られるものの、重要なギャップは残っている。
予後モデルにおけるレビューの選択
系統的レビューの包括的な検索を行った結果、様々な医療分野にまたがる多くの予測モデルを調べた研究が見つかった。合計で、8つの注目すべきレビューがより深く分析されることになったよ。
これらのレビューは、COVID-19、心不全、糖尿病、その他の病状に関する多様な分野をカバーしている。焦点が異なっていて、すべての利用可能な研究を含むものもあれば、現代的な技術を使用するモデルに特化したものもある。
これらのレビューがどのくらいの研究を調べ、どのようなモデルを評価し、測定された結果の範囲がどれくらいなのかをよりよく理解することが目的だった。
系統的レビューからの重要な発見
研究とモデルの数
レビューの中で、予測モデリングに焦点を当てた出版された研究の数が増加しているという明確な傾向が見られる。最近の数年は、この分野における研究のボリュームが顕著に増加している。
ほとんどのレビューでは、多くのモデルが調査され、数百の異なる予測モデルからの結果が報告されている。これらのモデルの多くは最近の数年以内に出現しているので、臨床実践での予測の利用に対する関心の高まりが浮き彫りになっている。
研究における参加者データ
これらの研究に参加した参加者の数も、時間が経つにつれて増加してきた。最近のレビューでは、以前の年と比べて研究に参加した患者数が多くなっていると報告されている。
ただ、参加者の平均人数は増えているけど、実際の傾向としては少数の大規模な研究がこの数字に大きく影響している。つまり、研究の数が増えても、多くは比較的少ない数の参加者を含んでるってことなんだ。
報告された結果のイベント
結果のイベントは、予測モデルが予測しようとする具体的な健康結果を指す。多くのレビューでは、報告された結果のイベントの数が増加している一方で、研究間での不一致が残っていることを示している。
この報告の変動は、異なるモデルの効果を比較する際に課題をもたらす可能性があるよ。
使用された予測因子
予測因子は、これらのモデルが予測を行うために考慮する様々な要因を指す。レビューでは、モデルで使用される予測因子の数にばらつきがあることが明らかになった。候補となる予測因子の平均数は安定している一方で、実際にモデルで使用される最終的な予測因子の数も変動している。
多くの場合、最終的な予測因子が少ないと、よりシンプルなモデルになり、医療従事者が実際に適用するのが簡単になるかもしれない。
欠損データの処理
いくつかのレビューでは、多くのモデルが欠損データの扱いについて報告しなかったことが強調されている。この透明性の欠如は、提示された予測モデルの信頼性について懸念を引き起こす。
一般的には、完全事例分析などのシンプルな方法が使われているけど、これらの方法への依存は時間と共に大きく減少していないことが示されていて、改善の余地があるってことを示唆している。
モデルのパフォーマンス指標
モデルのパフォーマンスは予測モデルの効果を確認するために重要だよ。主要なパフォーマンス指標には、識別(どれだけモデルが異なる結果を区別するか)、キャリブレーション(予測された結果が実際の結果とどれだけ一致するか)、分類精度が含まれる。
識別指標の報告は増えているけど、キャリブレーションや分類指標については同じことが言えないんだ。この不一致は、さまざまなモデルの全体的な効果を判断するのを難しくする。
内部および外部検証
検証は、予測モデルが多様な環境でうまく機能することを確保するための重要なステップだよ。内部検証は、モデルを作成するために使ったデータセットとは異なるデータセットでテストするのを指し、外部検証は全く新しいデータでモデルをテストすることを意味する。
レビューの結果において、内部検証を受けるモデルの割合は時間とともに増えていることが示された。でも、外部検証は未だに少ないままで、外部検証を受けたと報告されているモデルはほんの一部しかない。これが、予測モデルの検証に関するより良い実践の必要性を示しているんだ。
使用されるモデルの種類
レビューは、予測研究で使用されるモデリングアプローチの種類を探った。かなりの部分が従来の統計的方法を利用している一方で、他は機械学習の手法を採用している。
どちらのアプローチも存在するけど、機械学習ベースのモデルへと大きな傾向が見られるわけではない。また、多くの研究が両方の方法を使用していると報告しているけど、結果は統計的方法が特定の研究分野では依然として人気であることを示している。
結論
医療における予測モデリングの状況は常に進化している。重要な進歩があったけど、これらのモデルの開発、報告、検証に関しては課題が残っている。
研究の数が増えていることや予測モデリングへの関心が高まっているのは嬉しいけど、データの質、ガイドラインの遵守、モデルの複雑さに対する懸念は依然として残っている。
臨床実践で予測モデルの有用性を高めるためには、方法論の標準化、報告の透明性の向上、そして堅実な外部検証の確保に注力することが大切だよ。そうすることで、医療は予測モデルをより効果的に活用して、正確でタイムリーな患者ケアを提供できるようになる。
予測モデリングにおけるトレンドや課題をよりよく理解することで、医療コミュニティは患者のさまざまな健康状態に対する治療戦略を改善し、結果を最適化するために取り組むことができる。
タイトル: Changes in prediction modelling in biomedicine- do systematic reviews indicate whether there is any trend towards larger data sets and machine learning methods?
概要: The number of prediction models proposed in the biomedical literature has been growing year on year. In the last few years there has been an increasing attention to the changes occurring in the prediction modeling landscape. It is suggested that machine learning techniques are becoming more popular to develop prediction models to exploit complex data structures, higher-dimensional predictor spaces, very large number of participants, heterogeneous subgroups, with the ability to capture higher-order interactions. We examine these changes in modelling practices by investigating a selection of systematic reviews on prediction models published in the biomedical literature. We selected systematic reviews published since 2020 which included at least 50 prediction models. Information was extracted guided by the CHARMS checklist. Time trends were explored using the models published since 2005. We identified 8 reviews, which included 1448 prediction models published in 887 papers. The average number of study participants and outcome events increased considerably between 2015 and 2019, but remained stable afterwards. The number of candidate and final predictors did not noticeably increase over the study period, with a few recent studies using very large numbers of predictors. Internal validation and reporting of discrimination measures became more common, but assessing calibration and carrying out external validation were less common. Information about missing values was not reported in about half of the papers, however the use of imputation methods increased. There was no sign of an increase in using of machine learning methods. Overall, most of the findings were heterogeneous across reviews. Our findings indicate that changes in the prediction modeling landscape in biomedicine are less dramatic than expected and that poor reporting is still common; adherence to well established best practice recommendations from the traditional biostatistics literature is still needed. For machine learning best practice recommendations are still missing, whereas such recommendations are available in the traditional biostatistics literature, but adherence is still inadequate.
著者: Lara Lusa, F. Kappenberg, G. S. Collins, M. Schmid, W. Sauerbrei, J. Rahnenfuehrer
最終更新: 2024-08-10 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.08.09.24311759
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.08.09.24311759.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。