Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療情報学

EHRのデータ欠損:COVID-19からの洞察

研究が、パンデミック中の欠落したラボデータと患者の結果の関連性を明らかにした。

― 1 分で読む


EHRの欠損データ研究EHRの欠損データ研究検査結果が患者の結果に関連している。
目次

電子健康記録(EHR)は、患者の紙のカルテのデジタル版だよ。病院では主に請求や医療業務の管理に使われてきたけど、最近は患者の結果を学んだり、病気を追跡したり、治療の効果をチェックするためにも使われてる。COVID-19のパンデミック中には、研究者たちがEHRを使って新型コロナウイルス、つまりSARS-CoV-2を研究したんだ。

EHRは便利だけど、分析するのにはいくつかの課題があるんだ。これらの記録は、患者の健康についての明確な詳細を示すクリーンなデータセットを作るために多くの準備が必要なことが多い。例えば、EHRは異なるフォーマットを持っていたり、データ収集のバイアスを引き起こしたり、診断にエラーが含まれることもある。それに、EHRシステム同士が互換性がない問題もあるし、一部の地域や病院はEHRを効果的に使うための技術や資金が不足していることもある。よく報告される大きな問題は、データが欠落していること – 収集されるべき情報が集められていないってことだね。

欠落データがあるからって、必ずしもケアが不足していたわけじゃないんだ。例えば、入院患者の場合、 labテストは定期的に行われるけど、その頻度は患者の状態の深刻さによって変わることがある。重症の患者はより厳密に監視されるから、テスト結果が少なくなることがある一方で、軽症の患者はデータにギャップが多くなることもあるんだ。

欠落データの特定のパターンは重要なことを教えてくれる。もし、特定のテストのグループが一緒に欠落することが多いなら、特定の病気が監視されている可能性があるんだ。通常は関係のないlabテストが一緒に欠落し始めた場合、新たな問題、例えば感染が発生した可能性があるかもしれない。これらの欠落データパターンは、既存の健康問題を特定し、入院患者の状態を追跡するのにも役立つよ。

研究によると、欠落データを考慮することは、患者の結果を予測するモデルを改善するのに役立つんだって。例えば、いくつかの研究では、欠落データを使って長期的な病気や他の健康状態をよりよく理解する方法が探求されたんだ。

パンデミック中、医者たちはCOVID-19の管理についてもっと学んだし、2020年から2021年の変化は、この病気を理解し治療する新しい方法を反映しているかもしれない。患者の他の健康問題や監視の実践についての情報は、ケアを改善し、医療システムへの負担を減らすために重要なんだ。この研究は、パンデミック中の欠落データを調べて、特に重度の呼吸器の問題を抱える長期入院患者をよりよく理解し、これらの患者の90日間の死亡リスクを評価することを目的としているよ。

研究の詳細

この研究は、病院にいる患者を観察していて、適切なレビュー委員会から承認を受けているんだ。データは、COVID-19の臨床研究グループに関与しているペンシルベニア州の病院から収集された。病院は約2,500のベッドを持っていて、年間10万人以上の患者を治療している。研究に参加するには、患者がCOVID-19の陽性であり、少なくとも14日間入院している必要があるんだ。最初の入院時のデータだけが分析され、COVID-19患者の悪い結果に関連する16の特定のlabテストに焦点を当てたよ。

研究に含まれるのは、長期入院患者だけだから、特に70歳以上の高齢者は含まれる可能性が低かったんだ。これは、重度のCOVID-19を抱える高齢患者が14日間も入院するほど回復することが少ないからだよ。

この研究では、欠落データは特定の日にlabテストが行われなかったこととして定義されている。その欠落データの量は、テストが実施されなかった頻度に基づいて計算されるんだ。この欠落データが必ずしもケアの質が悪かったことを示すわけじゃないことが重要だよ。一部のテストは数日ごとに定期的に行われることがあって、時間をかけて見ると大量の欠落データを作ることがあるんだ。

研究者たちは、患者を観察するために2つの期間を定義したんだ: フェーズ1(2020年)とフェーズ2(2021年)。欠落データを研究する際に、公平な比較を確保するために、患者の入院の最初の14日間だけを見ていたよ。

lab結果のパターンを探る

早い段階で、研究者たちは欠落データパターンに基づいてlab結果の関係を理解しようとしていたんだ。目標は、類似の欠落傾向を示すテストをグループ化して分析を簡単にすることだった。これをするために、Latent Dirichlet Allocation(LDA)という統計手法が使われたんだ。この方法は通常テキストデータに適用されるけど、ここではlab結果に利用されたんだ。

分析は、一緒に欠落することが多いlabテストのグループを見つけることを目指していた。この方法を使って、研究者たちは欠落データパターンに基づいてトピックを特定したんだ。2020年と2021年の異なるモデルを作成し、どのトピック数がデータの理解に最適かを評価したよ。

labの確率データを見て、研究者たちはテストの関係性を評価することができたんだ。もし2つのテストが一緒に欠落する確率が高い場合、それらがつながっている可能性を示していたよ。

この分析から、研究者たちは生物学的に意味のあるlabテストのクラスタを特定したんだ。これらのクラスタには、炎症、感染、腎機能、肝機能に関連するテストが含まれていて、2年間にわたって欠落データのパターンが見られたんだ。また、Prothrombinのようにこれらのクラスタに合わない単独のlabテストもいくつか見られたよ。

欠落テストデータと患者の状態の関連付け

研究チームは、欠落したlabテストデータが急性呼吸窮迫症候群(ARDS)に関連するかどうかに特に興味を持っていたんだ。ARDSは、COVID-19患者に発生する可能性のある深刻な肺の状態だよ。前の分析の結果を使って、彼らは各クラスタとlabテストの欠落スコアを計算して、それらのスコアがARDSとの関連をどう示すかを見たんだ。

患者は特定の診断コードに基づいてARDSがあると見なされたよ。研究者たちは、年齢、人種、既存の健康状態などの要因を考慮した統計的方法を使って、結果の信頼性を確保したんだ。これによって、欠落データの影響を絞り込むことができたよ。

2020年には、ARDSがあることはほとんどすべてのlabテストにおいて欠落データが少ないことと関連していたけど、感染関連や腎関連のlabテストは例外だったんだ。2021年には、この関連が変わって、腎関連のテストにおける欠落データがARDS患者にとって重要になったんだ。

患者の死亡率の検討

研究者たちは、欠落したlabテストデータを使って特にARDS患者の90日間の死亡率を予測できるかどうかを調べようとしていたよ。患者は入院から3か月以内に亡くなった場合、90日間の死亡率を経験したと記録されたんだ。

再度、研究者たちは特定のlabテストの欠落が死亡率と関連しているかを確認したよ。2020年には強い関連は見られなかったんだけど、2021年には、肝関連のテストにおいて欠落データが多いことが死亡リスクが高いことと関連しているように見えたんだ。

Prothrombinやプロカリセトニンのレベルに関するパターンも観察されたけど、結果はあまり重要ではなかったんだ。90日間生き残った患者の中には、血栓イベントの履歴がある人が多かったよ。

この研究を通じて、チームはARDS患者の欠落labデータを監視する重要性を強調したんだ。肝機能テストや他の関連するlabを密に監視することで、もっと良い結果が得られるかもしれないって。ただし、観察された傾向を確認するためには、より大きなサンプルサイズでのさらなる分析が必要だとも認めていたよ。

制限と今後の方向性

この研究にはいくつかの制限があるんだ。長期間の入院を要件とすることが、患者集団にバイアスをかける可能性があるんだ。入院が長く続く患者は、COVID-19の広い範囲の患者を代表していないかもしれないよ。

また、研究の時間枠も制限になっているんだ。もっと最近のデータがあれば、欠落データがARDSに関する関連を明らかにし、死亡予測の助けになるかもしれない。それに、研究におけるARDS患者の数が少ないことも、結果の重要性を制限しているかもしれない。

研究者たちは、他の病院のデータを統合して分析を広げることに関心を持っていたんだ。さらに他の年を探求し、COVID-19と共に発生する他の健康状態をさらに調べる予定だよ。

結論として、この研究はCOVID-19のパンデミック中におけるlabテストの欠落データと患者の結果との関係を強調しているんだ。lab結果をグループ化してその関係を調べることで、研究者たちはケアを改善し、今後の研究を知らせる洞察を得たいと考えているよ。欠落データの使い方を理解することは、今後の患者ケア管理の改善に重要な役割を果たすかもしれないんだ。

オリジナルソース

タイトル: Leveraging informative missing data to learn about acute respiratory distress syndrome and mortality in long-term hospitalized COVID-19 patients throughout the years of the pandemic

概要: Electronic health records (EHRs) contain a wealth of information that can be used to further precision health. One particular data element in EHRs that is not only under-utilized but oftentimes unaccounted for is missing data. However, missingness can provide valuable information about comorbidities and best practices for monitoring patients, which could save lives and reduce burden on the healthcare system. We characterize patterns of missing data in laboratory measurements collected at the University of Pennsylvania Hospital System from long-term COVID-19 patients and focus on the changes in these patterns between 2020 and 2021. We investigate how these patterns are associated with comorbidities such as acute respiratory distress syndrome (ARDS), and 90-day mortality in ARDS patients. This work displays how knowledge and experience can change the way clinicians and hospitals manage a novel disease. It can also provide insight into best practices when it comes to patient monitoring to improve outcomes.

著者: Emily J Getzen, A. L. Tan, G. Brat, G. S. Omenn, Z. Strasser, The Consortium for Clinical Characterization of COVID-19 by EHR (4CE), Q. Long, J. H. Holmes, D. Mowery

最終更新: 2023-12-19 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事