データで希少疾患の診断を改善する
この研究は、データが希少疾患の診断をどれだけ早めるかを強調してるよ。
― 1 分で読む
目次
珍しい病気は厄介だよね。全体で見ると約10%の人に影響を与えるけど、実際はそれぞれがかなり珍しいのが特徴。だから、多くの医者はそれを見分ける経験がないかもしれない。こうした病気に悩む患者は、正しい診断が出るまでに長い時間、時には数年待たされることがある。この待機時間は、無駄な検査や効果のない治療、あるいは状況を悪化させることにつながることもあって、生活の質が低下してしまう。こうした遅れは、社会全体にも影響をもたらして、生産性の低下や医療費の増加などの問題を引き起こす。
具体例: 急性肝ポルフィリン症 (AHP)
珍しい病気の一例が急性肝ポルフィリン症(AHP)。これは、体がヘムを作るのに影響を与える遺伝性の病気のグループなんだ。AHPを持っている人は、体内の特定の化学物質の蓄積によるエピソード中に激しい痛みを感じることがある。これらのエピソードは神経にダメージを与えることがあって、繰り返し起こる人は神経系、肝臓、腎臓に影響を及ぼす深刻な合併症のリスクがある。
AHPはあまり一般的ではなく、約10万人に1人が影響を受ける。これが非常に珍しいから、患者は平均15年もの間、正しい診断を得られないことがある。この長い待機時間は、重大な健康問題や生活の質の低下を引き起こすことがある。幸いなことに、新しい治療法が登場して、患者が自分の状態を効果的に管理するチャンスが増えた。でも、診断までの時間を短縮することが、より良い結果にはまだ重要なんだ。
診断におけるデータの役割
新しい技術、特に機械学習や電子健康記録(EHR)は、AHPのような珍しい病気の診断を早める希望を提供している。EHRには、患者の症状、以前の診断、正しい診断に至るまで試みた治療に関する豊富な情報が含まれている。このデータを分析することで、機械学習モデルは、AHPや似たような状態を持つ患者をもっと早く特定できるようにトレーニングされることができる。
でも、こうしたモデルを構築するのは簡単じゃない。AHPが珍しいから、症例が少なすぎたり、他の病状が多すぎたりして、学習プロセスを混乱させることがある。さらに、EHRデータは時間と共に増え続けて、患者が医療システムを通過する際の複雑さを生む。モデルが未来の情報を使いすぎず、過去を予測するのが大事なんだ。
機械学習アプローチの開発
AHPの長い診断期間の問題に取り組むために、新しい機械学習(ML)アプローチが設計された。2つの医療センターのデータを使って、どの患者がAHP検査に促されるか、そしてその中で実際に陽性になる可能性がある患者を予測するモデルを訓練した。これらのモデルを構築した後、実際のシナリオでどれだけ効果的か評価された。
AHPの診断に向かう患者の旅を可視化するモデルが作成された。この旅には、2つの主要な意思決定ポイントがある:まず、患者が検査に紹介されるかどうか、次に、確認された診断を受けるかどうか。異なる要因がこれらの決定に影響を与えることが重要で、各段階ごとに別々のモデルが開発された。
患者の旅を理解する
診断に至る患者の旅は、いくつかの変数に影響されることがある。例えば、患者が医者を訪れる頻度、医療提供者の知識、患者が医療アドバイスに従う意欲などが考えられる。この研究では、患者がAHPの専門的検査に紹介される可能性や、検査された患者が確認された診断を受ける可能性といった2つの重要な「ボトルネック」が特定された。
モデル用にデータを準備するために、両センターのEHR情報が整理された。データには、診断や検査などの構造化情報と、医者のメモなどの非構造化情報が含まれていた。非構造化データを理解するためにさまざまな手法が適用され、診断予測に役立つ特徴が統計的手法や医療文献の知識を使って選ばれた。
モデルの訓練
それぞれのデータセットは異なるタスクに焦点を当てていて、1つはAHP検査に紹介される人を予測すること、もう1つは検査を受けた結果、病気が陽性になる人を予測することに集中していた。モデルは訓練され、評価され、さまざまな機械学習フレームワークを使ってパフォーマンスに基づいてアップグレードされた。
訓練プロセス中に、検査のために紹介された患者の方が、実際に検査を受けた患者よりも多く特定されたことがわかった。これは、多くの患者が検査を受けるよう勧められても、さまざまな個人的またはシステム的な理由で実行しないという医療システムのギャップを示しているかもしれない。
モデルのパフォーマンス評価
モデルはテストした際、期待できる結果を示した。AHPの紹介や陽性診断を予測する際に高いスコアを得ることができた。最高のモデルは、実際の診断日よりもずっと早く病気の可能性がある患者を特定するのに役立つかもしれない。
実際、モデルを遡って適用した際に、多くの患者が早く診断を受けることができた可能性があり、平均で1.2年の時間短縮が見られた。
実世界でのテストの課題
この興味深い結果にもかかわらず、チームはモデルを実世界の環境で検証する際に課題に直面した。患者に研究に参加してもらうのが難しく、特にAHPは珍しい病気で、多くの患者に連絡を取るのが容易ではなかった。連絡した患者のごく少数だけが参加に同意し、実施した検査でもAHPの陽性結果は得られなかった。
それでも、この研究の有望な性質は薄れない。結果は、EHRデータを使用して機械学習モデルを開発することで、特に珍しい病気の診断プロセスをより効率的にする助けになることを示している。
未来の研究への影響
この研究は、珍しい病気の予測と診断を改善することに焦点を当てた研究の増加に寄与している。研究には制限があったものの、臨床判断を下し、患者の結果を改善する上でEHRデータの力を強調した。今後の目標は、これらのモデルを洗練させ、より大規模で多様な集団で検証し、医療提供者を支援するための意思決定支援ツールを開発することだ。
要するに、このプロジェクトは珍しい病気のタイムリーな診断という複雑な問題に取り組もうとしている。まだやるべきことは多いけど、機械学習とデータ統合が珍しい病気の診断と治療の方法を変える可能性は大きい。早期発見を改善することで、患者は早く必要なケアを受けられ、より良い健康結果につながるかもしれない。
タイトル: Reducing diagnostic delays in Acute Hepatic Porphyria using electronic health records data and machine learning: a multicenter development and validation study
概要: ImportanceAcute Hepatic Porphyria (AHP) is a group of rare but treatable conditions associated with diagnostic delays of fifteen years on average. The advent of electronic health records (EHR) data and machine learning (ML) may improve the timely recognition of rare diseases like AHP. However, prediction models can be difficult to train given the limited case numbers, unstructured EHR data, and selection biases intrinsic to healthcare delivery. ObjectiveTo train and characterize models for identifying patients with AHP. Design, Setting, and ParticipantsThis diagnostic study used structured and notes-based EHR data from two centers at the University of California, UCSF (2012-2022) and UCLA (2019-2022). The data were split into two cohorts (referral, diagnosis) and used to develop models that predict: 1) who will be referred for testing of acute porphyria, amongst those who presented with abdominal pain (a cardinal symptom of AHP), and 2) who will test positive, amongst those referred. The referral cohort consisted of 747 patients referred for testing and 99,849 contemporaneous patients who were not. The diagnosis cohort consisted of 72 confirmed AHP cases and 347 patients who tested negative. Cases were female predominant and 6-75 years old at the time of diagnosis. Candidate models used a range of architectures. Feature selection was semi-automated and incorporated publicly available data from knowledge graphs. Main Outcomes and MeasuresF-score on an outcome-stratified test set ResultsThe best center-specific referral models achieved an F-score of 86-91%. The best diagnosis model achieved an F-score of 92%. To further test our model, we contacted 372 current patients who lack an AHP diagnosis but were predicted by our models as potentially having it ([≥] 10% probability of referral, [≥] 50% of testing positive). However, we were only able to recruit 10 of these patients for biochemical testing, all of whom were negative. Nonetheless, post hoc evaluations suggested that these models could identify 71% of cases earlier than their diagnosis date, saving 1.2 years. Conclusions and RelevanceML can reduce diagnostic delays in AHP and other rare diseases. Robust recruitment strategies and multicenter coordination will be needed to validate these models before they can be deployed. KEY POINTSO_ST_ABSQuestionC_ST_ABSCan machine learning help identify undiagnosed patients with Acute Hepatic Porphyria (AHP), a group of rare diseases? FindingsUsing electronic health records (EHR) data from two centers we developed models to predict: 1) who will be referred for AHP testing, and 2) who will test positive. The best models achieved 89-93% accuracy on the test set. These models appeared capable of recognizing 71% of the cases earlier than their true diagnosis date, reducing diagnostic delays by an average of 1.2 years. MeaningMachine learning models trained using EHR data can help reduce diagnostic delays in rare diseases like AHP.
著者: Vivek Ashok Rudrapatna, B. Bhasuran, K. Schmolly, Y. Kapoor, N. Jayakumar, R. Doan, J. Amin, S. Meninger, N. Cheng, R. Deering, K. Anderson, S. Beaven, B. Wang
最終更新: 2023-08-31 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2023.08.30.23293130
ソースPDF: https://www.medrxiv.org/content/10.1101/2023.08.30.23293130.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。