機械学習を使った院内感染の早期発見
機械学習モデルは入院患者の感染を予測して、より良い結果を得るために使われるよ。
― 1 分で読む
病院感染、いわゆる医療関連感染(HAIs)は、病院内の患者や医療システムにとって大きな問題だよ。毎日、約31人に1人の病院患者がHAIにかかっていて、アメリカでは毎年約99,000人がこの感染で亡くなってるんだ。COVID-19パンデミックもHAIの増加を引き起こして、予防策が完璧じゃないことがわかったんだ。これに対処するために、疾病予防管理センター(CDC)がこの10年間でガイドラインを作ってきたんだ。これらのガイドラインは臨床実践の改善や抗生物質の管理を目指してる。HAIを減らすためにいくつか進展はあったけど、特に重症患者にとって感染した後の状況を改善するのはまだ難しい。
感染の早期発見は患者の結果を改善したり、感染の広がりを防ぐ対策を取ったりするために重要なんだ。それに、医療コストを削減する助けにもなるよ。例えば、インフルエンザで入院した患者の中で多くが病院で感染するけど、症状が出たらすぐに抗ウイルス薬で治療すると結果が良くなるんだ。同じように、敗血症の患者に早めに抗生物質を与えると、特に人工呼吸器を使用している人たちの結果が良くなる可能性が高い。
臨床意思決定支援ツール
過去10年間、臨床の意思決定をサポートするツールが注目されてきて、特に感染を検出することを目的としたツールが多いんだ。これらのツールの多くは医師が作ったルールに基づいてるよ。ウェールズの病院で使われている急性腎障害(AKI)警告システムや、イギリスで一般的な臨床問題を見つけるために使用されているナショナルアーリーウォーニングスコア(NEWS)がその例だね。これらのツールは臨床医の経験に基づいているけど、特定の患者のニーズに適応する能力が欠けていて、複雑なケースをうまく捉えられないことが多い。最近の研究では、感染や敗血症のリスクを評価するためにデータを用いた予測ツールの作成が検討されているよ。
研究の概要
この研究は、病院からの大量のデータを使って、患者の早期感染検出のためのツールを作るために機械学習を利用することに焦点を当てているんだ。患者の人口統計データやさまざまなバイタルサイン、ラボテストの結果のデータを組み合わせて、臨床的に疑われる前に感染を予測できるモデルを開発することを目指してるよ。一番性能の良いモデルは、感染の臨床的な兆候が出る一時間前に高い精度を達成できて、臨床的な疑いが出る48時間前でも良いパフォーマンスを維持しているんだ。このモデルは、一般的に測定される少ないバイタルサインやラボ結果でも良好な精度を保っているんだ。
データ収集
この研究では、MIMIC-III、eICU、Banner Healthの3つの大規模病院データベースから臨床データを使用したよ。これらのデータセットには450以上の病院から650万件以上の患者訪問が含まれているんだ。データ使用に関しては関連する倫理審査委員会から承認を得て、プロジェクトが最小限のリスクを持っていて、患者の保護された健康情報は完全に削除されたため、患者の同意は必要なかったんだ。
感染とコントロールグループ
この研究では、特定の診断コードとラボテストに基づいて確認された感染のある患者を特定したよ。入院後少なくとも48時間経ってから感染の兆候があった患者は感染群に分類された。同時に、感染に関連する診断やラボテストがない患者からコントロール群が作られた。このバランスを保つために、コントロール群はサイズが減らされたんだ。これで感染患者が全体のデータセットの特定の割合を占めることができたよ。
もし一部の病院に十分なラボデータがなかった場合、特定の抗生物質を受けた患者は感染群に入れられたんだ。抗生物質がいつ投与されたかによって感染の臨床的な疑いが決定されるんだ。
データの公平な比較を行うために、コントロール群のデータから合成イベント時間が作られた。この方法により、感染データに合わせた一貫性のあるデータ抽出が可能になったんだ。
研究で使用された特徴
研究で使われた特徴は、3つのタイプのデータから構成されているよ:患者の人口統計(年齢、性別、身長、体重)、バイタルサイン(心拍数、血圧、体温)、ラボテストの結果(血液検査、代謝パネル)。データが集まったら、クリーンアップと前処理が行われて、一貫したデータセットが作成されたんだ。
機械学習モデルをトレーニングするために、研究者たちは感染の臨床的な疑いが出る1時間前の最新の測定値を集めるための時間を定義したよ。さらに、バイタルサインデータのトレンドも予測に役立てられたんだ。
使用されたアルゴリズム
この研究では、2つの主要なアルゴリズムが使用されたよ:元のデータのパターンを探す線形分類器と、複数のモデルを組み合わせて精度を向上させるアンサンブル法だ。モデルを臨床で使いやすく保ちながら、実用的なアプリケーションのためのリソース使用を最小限に抑えることに焦点を当ててる。具体的には、線形分類のためにロジスティック回帰が採用され、決定木を用いた勾配ブースティングなど、さまざまなブースティング手法が使われたんだ。
データセットは感染患者とコントロール患者の間に不均衡があったため、研究者たちはモデルの公平なトレーニングとテストを保証するために特別なクロスバリデーション技術を使用したよ。
モデルのパフォーマンス
機械学習モデルは、感染患者とコントロール患者を区別する能力に基づいて評価されたんだ。その結果、勾配ブースティングモデルが一番良いパフォーマンスを示して、高い精度を達成したよ。他のモデル、例えばロジスティック回帰は、あまり良い結果を出さなかった。研究者たちは、機械学習モデルと確立された臨床評価ツールを比較したんだ。たとえば、基本的な体温測定だけでは感染を予測するのにはあまり効果的じゃなかった。
モデルは、使用する特徴の数を減らしても、バイタルサインや人口統計にだけ焦点を当てても、パフォーマンスが許容範囲内に留まることを示した。感染を前もって予測できれば、タイムリーな医療介入ができて、命を救う可能性があるよ。
インサイトと重要性
この研究では、異なる感染タイプがモデルの検出パフォーマンスにどのように影響するかも調べられたんだ。モデルは、敗血症や血流感染のような重度の感染に対して最も効果的に機能することがわかったよ。さらに、慢性疾患のない患者の方が、慢性疾患のある患者よりも感染を除外する能力が良かったんだ。
この研究を通じて、機械学習を使った院内感染の早期予測が大きな利益をもたらす可能性があることが分かったよ。特に、適切なデータポイントに基づくモデルは、医療提供者によって疑われる48時間前に感染を特定できることが期待されるんだ。
結論
この研究は、機械学習が入院患者の感染を早期に検出するために効果的に使用できることを示してるよ。モデルは実行可能なインサイトを提供して、迅速な治療と患者の結果向上につながるんだ。既存の病院モニタリングシステムを利用することで、これらのモデルは医療従事者が情報に基づいた意思決定をするのを助けることができるよ。頻繁に測定される特徴が限られていても、モデルは強いパフォーマンスを維持して、現実の病院環境での早期感染検出を可能にするんだ。
タイトル: Machine Learning-based Clinical Decision Support for Infection Risk Prediction
概要: BackgroundHealthcare-associated infection (HAI) remains a significant risk for hospitalized patients and a challenging burden for the healthcare system. This study presents a clinical decision support tool that can be used in clinical workflows to proactively engage secondary assessments of pre-symptomatic and at-risk infection patients, thereby enabling earlier diagnosis and treatment. MethodsThis study applies machine learning, specifically ensemble-based boosted decision trees, on large retrospective hospital datasets to develop an infection risk score that predicts infection before obvious symptoms present. We extracted a stratified machine learning dataset of 36,782 healthcare-associated infection patients. The model leveraged vital signs, laboratory measurements and demographics to predict HAI before clinical suspicion, which is defined as the order of a microbiology test or administration of antibiotics. ResultsWe find that our best performing infection risk model achieves a cross-validated AUC of 0.88 at 1-hour before clinical suspicion and maintains an AUC>0.85 for 48-hours before suspicion by aggregating information across demographics and a set of 163 vital signs and laboratory measurements. A second model trained on a reduced feature space comprising demographics and the 36 most frequently measured vital signs and laboratory measurements can still achieve an AUC of 0.86 at 1-hour before clinical suspicion. These results compare favorably against using temperature alone and clinical rules such as the quick Sequential Organ Failure Assessment (qSOFA) score. Along with the performance results, we also provide an analysis on model interpretability via feature importance rankings. ConclusionsThe predictive model aggregates information from multiple physiological parameters such as vital signs and laboratory measurements to provide a continuous risk score of infection that can be deployed in hospitals to provide advance warning of patient deterioration.
著者: Bryan Conroy, T. Feng, D. Noren, C. Kulkarni, S. Mariani, C. Zhao, E. Ghosh, D. Swearingen, J. Frassica, D. Mcfarlane
最終更新: 2023-05-09 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2023.04.27.23289212
ソースPDF: https://www.medrxiv.org/content/10.1101/2023.04.27.23289212.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。