機械学習で冬の医療需要を予測する
この研究は、冬の間の医療ニーズを予測する際の機械学習の役割を強調してるよ。
― 1 分で読む
目次
毎年冬になると医療サービスの需要が増すんだよね。これが必要な健康サービスを提供する上で大きな課題になることがあるんだ。寒い天気やウイルスの広がりがこの需要増に寄与してるんだよ。特にインフルエンザと呼吸器合胞体ウイルス(RSV)がこの季節の圧力の主要因だね。
RSVは特に幼い子供に影響を与えて、免疫力が低い子には深刻な健康問題を引き起こすことがあるんだ。世界中で乳児死亡の主要な原因にもなってるしね。RSVやインフルエンザの症例が増えると、家庭医から病院まで医療サービスの需要が優に増すんだよ。イングランドでは、RSVが5歳未満の子供に対して年間約30,000件の入院を引き起こしてる。
この冬の圧力に対応するためには、主要な原因を特定して健康のトレンドを密に監視することが重要なんだ。公衆衛生において監視は不可欠で、専門家が病気の活動の変化を追跡したり、未来の圧力を予測したりできるようにするんだ。病気のトレンドデータを分析することで、当局は季節的な医療ニーズの急増により良く備えられるんだよ。
予測における機械学習の役割
最近、技術の進歩で医療需要予測が改善されてきたんだ。機械学習を使えば、専門家がもっと大きくて複雑なデータセットを分析して、より良い予測モデルを作れるようになったんだ。ただし、これらのモデルの成功は、医療サービスの利用に関する信頼できて関連性のある監視データを持っているかどうかに依存するんだ。
この文脈で、私たちは健康機関が定期的に収集しているリアルタイムデータを使って、呼吸器ウイルスのピークシーズン中の医療需要の短期予測を行ったんだ。このデータのおかげで、自分たちの予測がどれだけ信頼できるか計算できて、2022-2023年の冬の活動と比べることができたんだ。
最初に予測モデルを選んでトレーニングするための2つの自動化された機械学習プロセスを構築したんだ。それから、日毎の予測を生成するんだ。このアプローチによって、医療圧力をもっと正確に予測できるようになったんだよ。
データ選択
健康機関は、さまざまな健康監視イニシアティブを支援するためにリアルタイムの監視プログラムを運営してるんだ。この研究では、特に2つの指標に注目したんだ:咳に関するNHS 111のテレヘルスコールと急性細気管支炎のための救急科訪問。これらの指標は、RSVの流行に対して脆弱な幼い子供に特に関連があるんだ。
分析は5歳以下の子供に限ったんだ。そうすることで、季節的な問題を経験しやすいからね。確立された指標を使うことで、私たちの結果をより良く解釈できて、過去のデータと比較できるんだ。
データのクリーンアップと準備
分析のためにデータを準備するために、最初に週末や祝日によって引き起こされた不規則性を取り除いたんだ。それから、データを標準的な範囲に収めるように正規化したんだ。予測モデルの開発を助けるために追加の変数も作ったんだけど、すべての派生変数が試したすべてのモデルで使われたわけではないんだ。
モデルのトレーニング
1つの予測方法に依存するのではなく、両方の指標のためにいくつかの異なるアプローチを探ったんだ。線形回帰やランダムフォレスト回帰、その他何種類かの機械学習技術をテストして、どれが一番効果的か見てみたんだ。
各方法について、季節パターンや時間の経過に沿ったトレンドを考慮するかなど、さまざまなオプションを見たんだ。これらの方法とオプションを組み合わせて、多くのモデルをテストすることができたんだよ。それぞれのモデルは、2022年10月以前の履歴データを使ってトレーニングされたんだ。
私たちは、健康機関が定期的に収集する匿名データを利用したんだ。これは呼吸器疾患の監視の一環として行われている研究で、データを使用するために特別な許可は必要なかったんだ。
ベストモデルの選択
多くの異なるモデルをテストした結果、次の28日間にいつ、どれくらいの活動がピークに達するかを予測するために各モデルのアンサンブル予測を作ったんだ。「予測ピーク」を各モデルによって予測された最高値として定義したんだ。それから、これらの予測されたピークを、次の28日間に実際に発生したピークと比較したんだ。
予測と実際のピークの高さとタイミングの違いを計算することで、各モデルのパフォーマンスを評価することができたんだ。エラーが最も少なかったモデルが、日毎の予測用に選ばれたんだ。
モデルの検証
履歴データに基づいてベストモデルを選んだら、利用可能な過去のデータを使ってモデルを再トレーニングしたんだ。これによって予測を改良して、それに関する不確実性を見積もることができたんだ。活動レベルが変わるに伴ってエラーの変動に対応するために、特定のモデルを適用して、現在の活動レベルによってエラーがどのように変わるかを見積もりながら進めたんだ。
このプロセスは、予測に不確実性の範囲を伴わせて、どれくらいの変動が予測にあるかを理解するのに役立つんだ。
日次レポートの生成
日次の予測では、最近のデータを抽出して、前と同じクリーンアップと準備の手順を使ってフォーマットするんだ。検証されたモデルは1日から28日先の予測を行い、これらの予測は予想されるピークとその不確実性を示す日次レポートにまとめられるんだよ。
2022-23年のパイロットシーズンからの洞察
2022年10月、5歳未満の子供における急性細気管支炎のための救急科訪問が増え始めて、10月31日にピークに達したんだ。しばらく減った後、入院は再度増加し、最終的には11月末にさらに高いピークに達したんだ。NHS 111の咳のコールも同じようなパターンを辿って、特定の日に著しいピークがあったんだ。
これらのピークは、例年のRSV活動と一致しているんだ。ただ、12月には子供の侵襲性A群ストレプトコッカス感染に関するメディア報道に対応して、NHS 111のコールが異常に増え、このためRSV活動の解釈が混乱したんだ。
11月26日に行った予測では、救急科への訪問が実際のピークよりも高くなると予測していたんだ。私たちのNHS 111の予測は、咳のコールの前例のない増加に対応しきれなかったけど、後にもっとシンプルな線形回帰法が新しいトレンドに適応していくのが明らかになったんだ。
主な発見
私たちの自動化された機械学習プロセスは、RSVによるピークの医療需要を予測するモデルをうまくトレーニングできたんだ。2022年のパイロット予測では、幼い子供の医療需要を正確に予測できたんだ。
予測では通常11月にピークがあると示したけれど、12月のNHS 111のコールの予期しない増加にも適応したんだ。これによって私たちのモデルが変化を捉える能力があることが示された一方で、外的要因が患者の行動に影響を与えた場合には限界もあることが分かったんだ。
公衆衛生への影響
短期予測は、従来の監視方法を超えた重要な情報を提供できるんだ。私たちの自動化されたシステムは、典型的なシーズン中のピークのタイミングと強度を特定する予測を迅速に生成できるんだ。この柔軟性は、新しいデータソースを迅速に追加して予測を向上させることを可能にするんだよ。
ただし、これらの予測は新たな健康の脅威に対処するために専門家の分析の文脈内で解釈する必要があることを重要視するべきなんだ。これによって、公衆衛生当局が病気の発生や患者の行動に突然の変化に正確に対応できるようになるんだ。
今後の作業のための推奨事項
予測を解釈する際、特に異常なシーズン中は注意が必要なんだ。特に現在のデータが過去の範囲を超えた場合は、ルーチン監視予測で過去の経験から外れたデータをフラグするテストを組み込むことをお勧めするよ。
今後は、珍しいシーズン中の予測精度を改善するために、トレーニングデータの重み付けを調整して稀なイベントを強調したり、まだ発生していない理論的なシナリオを含めたりすることができるんだ。これによって、予測不可能な医療需要への準備をより良くして、タイムリーで証拠に基づいた対応ができるようにするんだ。
タイトル: Using machine learning to forecast peak health care service demand in real-time during the 2022-23 winter season: a pilot in England, UK
概要: During winter months, there is increased pressure on health care systems in temperature climates due to seasonal increases in respiratory illnesses. Providing real-time short-term forecasts of the demand for health care services helps managers plan their services. During the Winter of 2022-23 we piloted a new forecasting pipeline, using existing surveillance indicators which are sensitive to increases in respiratory syncytial virus (RSV). Indicators including telehealth cough calls and ED bronchiolitis attendances, both in children under 5 years. We utilised machine learning techniques to train and select models that would best forecast the timing and intensity of peaks up to 28 days ahead. Forecast uncertainty was modelled usings a novel gamlss approach which enabled prediction intervals to vary according to the level of the forecast activity. The winter of 2022-23 was atypical because the demand for healthcare services in children was exceptionally high, due to RSV circulating in the community and increased concerns around invasive Group A streptococcal (GAS) infections. However, our short-term forecasts proved to be adaptive forecasting a new higher peak once the increasing demand due to GAS started. Thus, we have demonstrated the utility of our approach, adding forecasts to existing surveillance systems.
著者: Alex J Elliot, R. A. Morbey, D. Todkill, P. Moura, L. Tollinton, A. Charlett, C. H. Watson
最終更新: 2024-09-23 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.09.20.23296441
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.09.20.23296441.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。