Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 感染症(HIV/AIDSを除く)

データ分析でCOVID-19の入院者数を予測する

研究により、移動データと天気データを使ってCOVID-19の病院入院ケースの予測が改善された。

― 1 分で読む


COVIDCOVID19の入院予測が強化されたズ予測が改善されたよ。新しい方法でCOVID-19の病院のニー
目次

COVID-19のパンデミックは、2020年初頭から2021年末まで、世界中の病院に大きな影響を与えた。たくさんの人が感染し、残念ながら多くの命が失われた。2022年末までに、確認されたCOVID-19のケースは6億件を超え、健康機関によって660万人以上の死亡が報告された。この間、地域の保健当局は、病気がどのように広がっているかを理解するのが難しかった。この情報の不足は、病院の資源を効果的に管理するのを難しくし、予想以上に医療への影響を及ぼした。

病院は、COVID-19のケースが増加する中で、いつ非緊急の医療処置を延期する必要があるかを知る必要があった。ケースが多ければ選択的手術は待つ必要があった。一方、報告されたケースが少なければ、病院は延期された治療を取り戻すことに集中できた。新しい変異株が現れると、状況はさらに混乱を招いた。

イングランドやウェールズのような地域では、COVID-19の感染波が病院資源に重くのしかかった。ワクチン接種の努力が多少の圧力を和らげたが、高い感染率と死亡率は2022年まで続いた。これにより、地域の保健当局がケース予測のタイムリーな更新を受ける必要があることが浮き彫りになった。

COVID-19の拡散に影響を与える要因

ウイルスそのもの以外にも、感染の広がりには様々な要因が影響している。研究によると、病気の広がりは気候や温度などの気象条件と相関関係があることが示されている。フランスのような国で行われた研究では、予測モデルに気象データを含めると、COVID-19による病院入院の予測能力が向上することがわかった。

人々の行動もウイルスの広がりに大きな影響を与えた。人々の移動や相互作用に関するデータは、感染率や死亡者数の変動と一致する傾向を示していた。通勤パターンや社会的活動の要因を考慮することで、研究者たちは未来の病院入院に関する予測を向上させようとしていた。

この研究は、天候データと人々の移動に関する洞察を使って、よりローカルなレベルでCOVID-19病院入院を予測するモデルを構築することを目指している。

予測に使った手法

COVID-19の入院予測を改善するために、研究者たちは機械学習に基づく手法を使用した。以前の研究では、類似の技術を使ってインフルエンザ様疾患のケースを予測する方法を成功裏に開発した。今回は、その方法を拡張して、イングランドの7つの地域の週次COVID-19病院入院を予測するために、地域の気象条件や人間の移動パターンを取り入れた。

研究者たちは、気象データと移動データを追加したことで、予測がどれだけ改善されたかを見ていた。機械学習モデルが異なる状況でも正確さを保てるかどうかも確認した。

使用したデータには、COVID-19のケース、死亡者、病院入院、移動パターン、気象データが含まれていた。この情報のほとんどは公共に利用可能だった。病院入院データは2020年3月から追跡され、分析の一貫性を確保するために、研究者は2022年末までのデータを含めた。

予測のために、各地域の人口に基づいて病院入院の数字を調整し、地域ごとの比較を公平に行えるようにした。入院を異なるレベルに分類し、高いレベルがより多くの病院需要を示すようにした。

移動と気象データの収集

研究者たちは、Googleから移動データを収集し、パンデミック中に人々の移動がどのように変化したかを分析した。このデータは、ロックダウンが人々の日常生活や相互作用に与えた影響を示す洞察を提供した。

移動データを地域に合わせるために、研究者たちはローカルエリアに対応させるためのルックアップテーブルを使用した。これらの日々の移動値を平均して、地域レベルでの移動トレンドを明確に把握した。気象データ、気温や降水量を含め、別のソースから取得し、各地域ごとに平均化した。

予測モデルの構築

この研究で使用された主な予測モデルは、XGBoostという機械学習技術に基づいていた。この手法は通常、非順序で分類されたデータで機能するが、研究者たちはそれを順序データに使用する方法を開発した。元の分類問題をいくつかのバイナリ問題に変えることで、より多くの情報を保持し、予測を改善することができた。

新しいモデルとともに、彼らは結果を比較するためのベースラインとして、より伝統的な順序ロジスティック回帰手法を使用した。この手法はシンプルで、予測変数と結果の関係を理解するための便利な出発点を提供する。

研究者たちは、病院入院情報だけでなく、気象や移動データも予測因子として考慮し、異なる種類のデータをモデルに組み合わせた。

モデル性能の分析

研究者たちは、病院入院の予測においてモデルがどれだけ効果的かを慎重に分析した。特に、未来の更なる予測の課題を考慮し、予測が遠くなるほど正確さを保つのが難しくなることを認識していた。

彼らの調査結果は、疫学データのみを使用したモデルが、より伝統的な手法と比較して驚くほど良好に機能したことを示していた。移動データを追加することでさらにモデルは改善され、気象データを含めても正確さは大きく向上しなかった。

様々な予測因子の組み合わせを見直す中で、移動データを組み込んだモデルが、単に疫学データに依存したモデルを常に上回ることが明らかになった。研究者たちは異なるデータの組み合わせを試す中で、移動データと気象データの両方を使用したモデルが最良の結果をしばしば達成することに気づいた。

地域ごとのバリエーションと洞察

異なる地域における病院入院データを調査することで、パンデミック中に特定のパターンがどのように現れたかを明らかにした。例えば、2021年初頭のアルファ変異株の急増時には、NHS地域全体で入院がピークに達した。その後、全国的なロックダウンやワクチン接種のおかげで、春や夏の間に入院率は低下した。

しかし、デルタ株やオミクロン株のような新たな変異株は、入院の再急増を引き起こし、ウイルスの変化が医療の需要を大きく変える可能性があることを示した。

結果の予測を分析する中で、移動データを利用したモデルが、そうでないモデルに比べて予測誤差が低いことがわかった。時間が経つにつれて、移動データを使用することの影響がより明確になり、予測された入院と実際の入院との関係を詳しく見ることでその傾向が強調された。

結論

この研究は、進行中のCOVID-19パンデミックの間、病院入院レベルを理解し予測することの重要性を強調している。移動データと気象データを伝統的な疫学情報と統合することで、研究者たちは病院のニーズを予測する正確性を向上させることができた。

この研究から得られた洞察は、公衆衛生当局がより良い計画を立て、資源をより効率的に配分するのに役立つ。COVID-19がもたらす課題が続く中、信頼できる予測モデルを持つことは、効果的な医療管理とコミュニティが進化する状況に迅速に対応するために重要である。

オリジナルソース

タイトル: Forecasting regional-level COVID-19 hospitalisation in England as an ordinal variable using the machine learning method

概要: BackgroundCOVID-19 causes substantial pressure on healthcare, with many healthcare systems now needing to prepare for and mitigate the consequences of surges in demand caused by multiple overlapping waves of infections. Therefore, public health agencies and health system managers also now benefit from short-term forecasts for respiratory infections that allow them to manage services better. However, the availability of easily implemented effective tools for generating precise forecasts at the individual regional level still needs to be improved. MethodsWe extended prior work on influenza to forecast regional COVID-19 hospitalisations in England for the period from 19th March 2020 to 31st December 2022, treating the number of hospital admissions in each region as an ordinal variable. We further developed the XGBoost model used previously to forecast influenza to enable it to exploit the ordering information in ordinal hospital admission levels. We incorporated different types of data as predictors: epidemiological data including weekly region COVID-19 cases and hospital admissions, weather conditions and mobility data for multiple categories of locations (e.g., parks, workplaces, etc). The impact of different discretisation methods and the number of ordinal levels was also considered. ResultsWe find that the inclusion of weather data consistently increases the accuracy of our forecasts compared with models that rely only on the intrinsic epidemiological data, but only by a small amount. Mobility data brings about a more substantial increase in our forecasts. When both weather and mobility data are used in addition to the epidemiological data, the results are very similar to the model with only epidemiological data and mobility data. ConclusionAccurate ordinal forecasts of COVID-19 hospitalisations can be obtained using XGBoost and mobility data. While uniform ordinal levels show higher apparent accuracy, we recommend N-tile ordinal levels which contain far richer information. Author SummaryAt the regional level, we address the pressing need for precise short-term forecasts of respiratory infections, particularly COVID-19. We focus on the specific context of England and cover the period from January 1 to December 31, 2022. We introduced an enhanced XGBoost model that leverages the ordinal nature of hospital admission data, utilising a combination of predictors, including epidemiological data, weather conditions, and mobility data across various location categories. Our findings indicate that the inclusion of weather data marginally improves forecasting accuracy, while mobility data yields more significant enhancements. This research contributes valuable insights for public health agencies and healthcare system managers in their ongoing efforts to manage and respond to the complexities of the COVID-19 pandemic.

著者: Steven Riley, H. Wang, K. O. Kwok, R. Li

最終更新: 2023-10-17 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.10.17.23297138

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.10.17.23297138.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

高エネルギー天体物理現象HESS J1843-033の近くで新しいガンマ線源が発見されたよ。

研究によると、HESS J1843-033の近くにあるガンマ線源TASG J1844-038が宇宙線についての新たな手がかりを提供しているらしい。

― 1 分で読む

類似の記事