Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療情報学

機械学習を使った退院予測の改善

研究によると、機械学習モデルが病院の退院予測を改善できるって。

― 1 分で読む


病院退院予測モデル病院退院予測モデルtiming の精度を高める。機械学習が出 discharge
目次

世界中の医療システムは、増加する需要により圧力がかかってるんだ。これは、人口動態の変化、慢性疾患を抱える人が増えてること、社会の変化、技術の進歩によって影響を受けてる。イギリスでは、国民健康サービス(NHS)が特にこの圧力を感じていて、病院に来る患者が増え、緊急部門での待機時間が長くなって、財政的な困難もある。COVID-19パンデミックはこれらの問題をさらに悪化させて、緊急医療と定期的な医療の両方で大きな遅れを引き起こした。

病院のリソースは限られているから、効率を高めて患者のキャパをうまく管理する方法を見つける必要がある。その重要な部分は、患者の流れを効果的に管理すること、つまり患者が病院に入ってから退院するまで、正しいケアを受けながら導くことなんだ。

患者の流れの重要性

患者の流れを最適化することで、患者の体験が良くなり、治療の待機時間が短くなり、健康結果が改善され、コスト削減にもつながる。患者の退院タイミングを正確に予測することは、患者の流れを向上させる重要な方法のひとつ。これにより、患者が退院準備が整ったときに医療提供者が知らせを受けられて、輸送の手配や退院用の薬の最終確認、次の患者用の病室の準備ができるようになる。

現在、退院予測は臨床チームが各患者の状況を診断や現在の状態に基づいて評価することに依存している。でも、これらの予測はしばしば一貫性がなくて主観的になることがあることが多い。多くの場合、それらは電子健康記録システムで追跡されていないことがあって、病院の運営が複雑になることも。だから、患者の滞在期間や退院タイミングを予測するために自動化された予測ツールを使うことへの関心が高まっている。

退院予測モデル

退院を予測することは、機械学習技術を使った研究者たちの注目の分野になってる。いくつかの研究では、次の24、48、72時間のような決まった時間枠に基づいて退院のタイミングを予測しようとしてきた。手術を受ける患者や心臓病の患者など特定のグループを対象にした研究もあれば、病院全体の退院を予測することを目指した研究もある。

さまざまな伝統的な機械学習技術が試されていて、ランダムフォレスト、ブーステッドツリー、ニューラルネットワークが含まれてる。これらの予測を行うために使用される特徴は通常、患者の人口統計、病歴、バイタルサイン、診断、手術、薬剤などが含まれる。一部のモデルは期待される結果を示したけれど、大部分は平均的なパフォーマンスで、成功率は異なる研究間で広くばらついてる。

印象的な例としては、臨床医の電子健康記録とのやりとりに関するデータを含むモデルがあり、24時間以内の退院を高い精度で予測できた。ただし、初回入院のみを対象にしていて、退院しなかった患者は除外されていた。このような既存の研究の多くは、トレーニングデータのサイズ、予測のタイミング、特定の患者グループに関連するパフォーマンスといった重要な領域に十分に取り組んでいない。

この研究の目標

この研究では、UKの大学病院グループからの電子健康記録データを使って、次の24時間以内に退院する患者を予測できる機械学習モデルを開発することを目的とした。個別の予測を組み合わせて、病院全体で予想される退院の合計数も推定する計画だった。

データと方法論

データソース

データは、オックスフォードシャー研究データベース(IORD)から取得され、オックスフォード大学病院 NHS 財団トラストの病院からの匿名化された電子健康記録を含んでいる。このグループには、約755,000人の人々を対象とする4つの大学病院が含まれている。

研究は、特定のカテゴリ(産科や小児科など)を除いた、2017年2月1日から2020年1月31日までの成人入院患者に焦点を当てた。入院は、計画された入院(選択的)と緊急入院(緊急)に分類された。

予測に使用される特徴

研究者たちは、既存の医療知識や過去の研究を考慮に入れて、モデルに使用する潜在的な特徴を特定した。これらの特徴には、患者の人口統計、現在の診断、過去の入院、検査結果、薬歴が含まれた。退院予測に役立つ堅牢なデータセットを作成することが目標だった。

予測タスク

研究は、指定された日時から24時間以内に患者が病院から退院するかどうかを予測することに焦点を当てた。個別のレベルの予測を集約して、その期間に病院全体で期待される退院の合計数の推定を行った。

異なる感度分析を行って、予測のタイミングが結果にどのように影響するかを評価した。モデルは歴史的データを使って訓練され、最近のデータで評価されて、その効果を確認した。

モデル開発

退院を予測するために、極端な勾配ブースティング(XGB)モデルが使用された。トレーニングデータは、研究期間の最初の2年間をカバーし、評価には最後の年のデータが使用された。モデルはパフォーマンスを最大化するためにハイパーパラメータのチューニングを受けた。

モデルの実装は欠損データを許可したので、XGBはこれらのギャップを補完なしで処理することができた。研究者たちは、予測された退院の確率を調整して精度を確保した。

パフォーマンス評価

モデルの効果は、感度、特異度、陽性予測値、陰性予測値、全体の精度などのさまざまな指標を使用して評価された。病院レベルの予測のパフォーマンスも、予測された退院数と実際の退院数を比較することで評価された。

研究期間中に、52,590件の選択的入院と202,633件の緊急入院が記録された。短い入院をフィルタリングし、関連データを確認した結果、分析には48,039件の選択的入院と143,275件の緊急入院が含まれた。

結果

モデルのパフォーマンス

モデルは退院の予測において期待できる結果を示した。選択的入院の場合、モデルは曲線下面積(AUC)が0.871、緊急入院の場合はAUCが0.860だった。選択的入院の陽性予測値は0.555、緊急入院は0.571で、モデルが退院する可能性のある患者を特定するのに効果的であることを示している。

また、モデルのパフォーマンスは、トレーニングデータセットが大きくなるにつれて改善し、約12ヶ月のデータで飽和点に達することが分かった。さらに、正午に行われた予測は、他の時間帯と比較して最高の精度を示した。

特徴の重要性

分析は、患者の退院に関連する重要な特徴を特定した。選択的入院では、過去24時間に受けた薬の数や、患者が抗生物質のコースを完了したかどうかが最も重要な予測因子となっていた。緊急入院でも、同様の特徴が重要で、薬歴が退院予測において重要であることが示された。

サブグループ分析とモデルの公平性

研究者たちは、性別、人種、社会経済状態などの異なる人口グループでモデルのパフォーマンスを評価した。全体のパフォーマンスは一貫していたが、特に高齢者や入院期間が長い患者においては、いくつかの変動が見られた。モデルはこれらのサブグループでパフォーマンスが劣る傾向があり、より複雑なニーズがデータに十分に反映されていない可能性が示唆される。

制限と今後の方向性

この研究にはいくつかの制限があった。予測のホライズンが24時間だけだったため、病院運営の計画範囲が制限される可能性がある。また、モデルは構造化された電子健康データのみに依存していて、予測精度を向上させるための非構造化データを組み込んでいなかった。

研究の結論は、現在の機械学習モデルが期待できる結果を示すものの、改善の余地があるということ。今後は、非構造化データを取り入れたり、ディープラーニングアプローチを活用したりして、パフォーマンスをさらに向上させることを探求すべきだ。

結論

機械学習と電子健康記録データを統合することで、退院のリアルタイム管理を促進し、病院の運営を改善する可能性がある。この研究で開発されたモデルは退院イベントの予測において良好なパフォーマンスを達成し、患者ケアに関連する特定の特徴の重要性を示した。

これらの進展は、患者の流れ管理やリソース配分に利益をもたらし、最終的には良い医療提供につながる可能性がある。この研究は特定の病院グループに焦点を当てているけれど、これらのモデルの発見は、さまざまな環境での病院管理努力を支援するためのより広い適用可能性を示唆している。

オリジナルソース

タイトル: Improving patient flow through hospitals with machine learning based discharge prediction

概要: Accurate predictions of hospital discharge events could help improve patient flow through hospitals and the efficiency of care delivery. However, the potential of integrating machine learning with diverse electronic health records (EHR) data for this task has not been fully explored. We used EHR data from 01 February 2017 to 31 January 2020 in Oxfordshire, UK to predict hospital discharges in the next 24 hours. We fitted separate extreme gradient boosting models for elective and emergency admissions, trained using the first two years of data and tested using the final year of data. We examined individual-level and hospital-level model performance and evaluated the impact of training data size and recency, prediction time of day, and performance in different subgroups. Our individual patient level models for elective and emergency admissions achieved AUCs of 0.87 and 0.86, AUPRCs of 0.66 and 0.64 and F1 scores of 0.61 and 0.59, respectively, substantially better than a baseline logistic regression model. Aggregating individual probabilities, the total daily number of hospital discharges could also be accurately estimated, with mean absolute errors of 8.9% (elective admissions) and 4.9% (emergency admissions). The most informative predictors included antibiotic prescriptions, other medications, and hospital capacity factors. Performance was generally robust across patient subgroups and different training strategies, but lower in patients with longer lengths of stay and those who eventually died in hospital. Our findings highlight the potential of machine learning in optimising hospital patient flow and facilitating patient care and recovery.

著者: David W Eyre, J. Wei, J. Zhou, Z. Zhang, K. Yuan, Q. Gu, A. Luk, A. J. Brent, D. A. Clifton, A. S. Walker

最終更新: 2024-06-04 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.05.02.23289403

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.05.02.23289403.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事

人工知能GUICourse データセットで GUI エージェントを進化させる

GUICourseは、GUIエージェントのための特定のデータセットを使ってデジタルインターフェースとのインタラクションを向上させることを目指してるよ。

― 1 分で読む