ポストコビッド症状の診断の課題
医者はCOVID-19後の残る健康問題を特定するのが難しいんだよね。
― 1 分で読む
目次
コロナ後、一部の人はポストコロナ症候群(PCC)と呼ばれる持続的な健康問題を経験してるんだ。これには、初めのコロナ感染から数週間や数ヶ月続くさまざまな症状が含まれることがある。これらの状態を理解して診断するのは医者にとって難しいんだ。主にPCCが何を含むのかについてまだ混乱が多いからなんだよね。
アメリカの保健福祉省はPCCを重複する健康問題の集まりと説明してるから、診断がさらに難しくなってる。パンデミック以降、PCCについての情報は増えてきたけど、多くの医者はまだこれを治療するのが難しいと感じてるみたい。
2021年10月、PCC用の特定診断コード(U09.9)が導入されて、これらの患者をより標準的に特定する方法が整備されたんだけど、このコードの使い方は医者によって大きく異なっていて、さらに混乱を招いて、研究者がPCCの一般性について正確なデータを集めるのが難しくなってる。
診断率のばらつき
アメリカの退役軍人健康管理局の研究によると、COVID-19後のPCC診断率は医療センターによって3%から41%まで大きく異なってた。この違いは、各センターの診断アプローチの差から来てるみたい。他の研究では、これらの診断のかなりの部分が、CDCやWHOなどの健康機関によって設定された基準を満たしてないことが示されてる。
さらに、イギリスの研究では、PCC診断率が異なる医療提供者の電子健康記録(EHR)システムによって異なることが明らかになった。この診断の不一致は、これらの持続的な症状を持っている患者を特定してサポートするためのより良い方法が必要だという強いニーズを意味してる。
PCC特定の新たなアプローチ
PCC診断コードの不一致に伴う課題から、研究者たちはテクノロジー、特に機械学習を用いてこれらの状態を持つ患者を見つける新しい方法を探ってる。いくつかの研究者は、小規模な患者グループや調査を使ってClinical notesを分析するモデルをトレーニングして、PCCに関連する症状を認識するのに中程度の成功を収めてる。
他の研究では、構造化データを利用して、専門のPCCクリニックに通う可能性がある患者を予測してる。これらのアプローチは、PCCを経験しているかもしれない患者を見つけるのに有望な結果を出してるけど、主に専門のクリニックに焦点を当ててる。
プライマリケアのパターンに焦点を当てる
この研究は、一般的なプライマリケアの設定でPCCがどのように診断されているのかを詳しく見たかったんだ。私たちは統計分析と機械学習の技術を組み合わせて、異なる医者がPCC診断コードをどのように適用しているのか、PCCの患者の共通の特徴を理解することを目指したんだ。
最初のステップは、異なる医者によって記録されたPCC診断の数を調べて、各医師が患者にPCCとラベルを付ける傾向を示すのに役立てた。次に、患者が最初にCOVID-19と診断されてからPCCと診断されるまでの時間を分析した。このタイミングは正確な診断にとって重要だからね。
また、患者の人口動態や診療所や医師の特性など、さまざまな要因がPCC診断コードの記録にどのように影響を与えるかもチェックした。最後に、医者のClinical notesを使ってPCCの可能性がある患者に共通する特徴があるかどうかを考えてモデルをトレーニングした。
データソースと研究対象
この研究では、アメリカのファミリーコホート(AFC)からデータを使用した。このデータセットには、全米のプライマリケアクリニックからの健康情報が集められていて、1万2千人以上の医師と約800万人の患者の訪問が含まれてる。AFCのデータは2017年から2023年11月までのもので、年齢、人種、地理的背景において多様な患者のグループを表している。
分析のためのサンプルを選ぶ際、約20%の患者には人種や民族に関するデータが欠けていた。この患者たちには、検証された方法に基づいて最も可能性のある人種または民族が割り当てられた。
診療パターンの分析
異なる医者が診断基準をどのように適用しているのかをよりよく理解するために、私たちは2つの主要な側面を見た。1つは、医者の間でのPCC診断の分布、もう1つは患者のCOVID-19とPCC診断の間の時間だ。私たちは、PCC診断コードの導入以来PCCと診断されたすべての患者を含め、彼らのCOVID-19診断のタイミングと比較した。
調査の結果、多くの医師が非常に少ないPCC診断を記録していることが分かった。中には、PCCと診断した患者がたった1人しかいない医者もいれば、100人以上診断した医者もいた。この不均等な分布は、医者によってPCCを認識して文書化する傾向に差があることを示唆している。
コード文書化のモデル作成
以前の研究者たちのアプローチを用いて、私たちは医者がPCC診断コードを文書化するかどうかを予測する機械学習モデルを開発した。使用したデータセットには、関連する時間枠のランダムな患者訪問のサンプルが含まれている。
データセットの不均衡を考慮して、PCCコードを持つ患者が少ないため、データを調整してバランスを取った。それから、患者がPCC診断を受けるかどうかに影響を与えるさまざまな特徴を視覚化した。
Clinical notesの自然言語処理
研究の別の部分では、医師が患者訪問中に書いたClinical notesに焦点を当てた。これらのノートを分析することで、PCCの患者を特定するのに役立つ特定の症状やパターンがあるかどうかを見たかったんだ。
含まれたノートは、さまざまなCOVID-19症状に基づいて慎重に選定され、役立つ情報が含まれていることを確保するために最小限の長さ要件を満たしていた。分析のために5,000件のClinical notesが選ばれ、2人の家庭医がこれらのノートをレビューしてPCCに苦しんでいる可能性のある患者を特定した。
私たちは、基本的なバグ・オブ・ワーズアプローチからより高度な手法であるトランスフォーマーのようなさまざまなモデルを利用してこれらのノートを分析した。テクノロジーの進歩にもかかわらず、Clinical notesを使用してPCCの患者を特定するのは依然として難しいことが示された。
結果と結論
私たちの研究は、PCC診断コードの導入後、プライマリケアの医師がPCCを診断する方法に大きな違いがあることを明らかにした。このばらつきは、医者がPCCを構成するものについて同意しないことがあることを示唆していて、文書化に不一致が生じている。研究に参加したほとんどの医師はPCCの診断をまったく記録していなかったのに対し、ごく少数の医師が多くの診断を行っていた。
さらに、多くのPCC診断が健康機関によって設定されたタイミングガイドラインに従っていないことが分かった。これは診断基準の明確さが必要だってことを示してる。年齢や人種といった患者の人口動態が、PCCコードが文書化されるかどうかを決定するのに、他の臨床要因よりも大きな役割を果たしていた。
高度な自然言語処理の方法を使用しても、Clinical notesからPCCの患者を特定しようとした試みは強い結果を出せなかった。これは、患者の違いや医師のばらつきがPCCの診断や治療における課題に寄与していることを示してる。
私たちの研究は、PCCに関するより良い理解と明確なガイドラインの必要性を強調してる。プライマリケアの設定で働く医者は、この状態を正確に認識して管理するためのより多くのサポートとツールが必要だ。研究が続く中で、PCC診断コードの使用を監視することは、患者が必要な適切なケアとサポートを受けるために重要になるだろう。
タイトル: Heterogeneity of Diagnosis and Documentation of Post-COVID Conditions in Primary Care: A Machine Learning Analysis
概要: BackgroundPost-COVID conditions (PCC) present clinicians with significant challenges due to their variable presentation. ObjectiveTo characterize patterns of PCC diagnosis in generalist primary care settings. DesignRetrospective observational study Setting519 primary care clinics around the United States who were in the American Family Cohort registry between October 1, 2021 and November 1, 2023. Patients6,116 with diagnostic code for PCC; 5,020 with PCC and COVID-19 MeasurementsTime between COVID-19 and PCC (U09.9) diagnostic codes; count of patients with PCC diagnostic codes per clinician; patient-specific probability of PCC diagnostic code estimated by a tree-based machine learning model trained on clinician and specific practice visited, patient demographics, and other diagnoses; performance of a natural language classifier trained on notes from 5,000 patients annotated by two physicians to indicate probable PCC. ResultsOf patients with diagnostic codes for PCC and COVID-19, 43.0% were diagnosed with PCC less than 4 weeks after initial recorded COVID-19 diagnostic code. Six clinicians (out of 3,845 total) made 15.4% of all PCC diagnoses. The high-performing (F1: 0.98) tree-based model showed that patient demographics, practice visited, clinician visited, and calendar date of visit were more predictive of PCC diagnostic code than any symptom. Inter-rater agreement on PCC diagnosis was moderate (Cohens kappa: 0.60), and performance of the natural language classifiers was poor (best F1: 0.54). LimitationsCannot validate date of COVID-19 diagnosis, as it may not reflect when disease began and could have been coded retrospectively. Few options for medically focused language models. ConclusionWe identified multiple sources of heterogeneity in the documentation of PCC diagnostic codes in primary care practices after introduction of ICD-10 codes for PCC, which has created challenges for public health surveillance. Funding SourceUS CDC
著者: Nathaniel Hendrix, R. V. Parikh, M. Taskier, G. Walter, I. Rochlin, S. Saydeh, E. H. Koumans, O. Rincon-Guevara, D. H. Rehkopf, R. L. Phillips
最終更新: 2024-02-07 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.02.07.24302451
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.02.07.24302451.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。