Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療システムと質向上

自閉症スクリーニングのための健康データ活用

健康データを使って、自閉症スペクトラム障害のリスクがある子供を特定する。

― 1 分で読む


データで自閉症診断を改善すデータで自閉症診断を改善すすることを目指している。新しいモデルは自閉症のリスクを早期に特定
目次

自閉スペクトラム症ASD)は、個人のコミュニケーションの仕方や社会的なやり取り、行動に影響を与える状態だよ。ASDのある人は、友達を作ったり、社会的なサインを理解したり、うまく話すのが難しいことがあるんだ。繰り返し行動をすることもあって、同じ行動やフレーズを繰り返したりすることがあるよ。

ASDの診断増加

最近、ASDと診断される子どもが増えてるんだ。例えば、2018年には、アメリカの子どもたちの約44人に1人が8歳になるまでにこの状態と診断されたって報告があったよ。早期の診断は重要で、子どもがより良く成長できたり、サポートサービスに早くアクセスできる手助けになるんだ。ASDの子どもが早期に集中的な支援を受けると、行動や社交スキル、一般的な能力に改善が見られることが多いよ。

診断の課題

現在、ASDの診断は行動や症状を観察することに頼っていて、一貫性がなかったり精度が低かったりするんだ。この体系的なアプローチの欠如が、診断を見逃したり遅らせたりする原因になってるんだよ。早期発見の利点が知られているのに、普遍的なスクリーニングプログラムはまだないんだ。研究では、出産時の合併症や年上の親を持つことなど、ASDに関連するいくつかのリスク要因が見つかっているよ。でも、妊娠中や幼児期に収集された健康データを使ってスクリーニングを改善するチャンスがあるんだ。

健康データを使ったスクリーニング

医療記録からの健康データは、ASDのスクリーニングツールを作るのに役立つんだ。一部の研究では、健康記録を調べてASDのリスクのある子どもたちを特定できないか見てるよ。例えば、ある研究では約10万人の患者のデータを分析して、特定の要因(薬や親の年齢など)がASDのケースをある程度正確に特定するのに役立つことがわかったんだ。

他の研究では、異なる年齢の子どもたちにASDのケースを確認するために医療コーディングを使ってるよ。これらの研究は有望だけど、しばしばいくつかの要因しか見ていないんだ。機械学習(ML)は大量のデータを分析したり、多くの特徴を考慮したりできる方法だから、ASDを特定するのに役立つんだ。でも、こうした方法を大規模に適用するのはまだ課題があるんだよ。

深層学習とその可能性

深層学習(DL)は、大量のデータを分析するために複雑なモデルを使うMLの一種だよ。これらのモデルは、ASDのリスクがある人を予測するのに役立つ重要なパターンを見つけられるんだ。新しいバージョンのモデル、トランスフォーマーモデルは、古いモデルよりも効率的に学習できるんだ。これらのモデルをトレーニングする際に説明可能な人工知能(XAI)技術を取り入れることで、異なる要因が予測にどう影響するかをより良く理解できるようになるよ。

ある研究では、研究者がオンタリオからの健康データを使って、ASDのリスクが高い幼い子どもを特定できるかを調べることを目指したんだ。

研究方法

その研究では、健康記録を収集する研究機関からのデータを使ったよ。母親と子どもたちの健康データを時間をかけて調べたんだ。目的は、出産前後のさまざまな健康要因に基づいてASDの診断を予測することだったよ。

研究者たちは、データを分析するために、トランスフォーマーモデルとXGBoostという別のMLモデルの2つを使ったよ。健康記録を使って予測モデルを作成し、さまざまなデータセットを使ってそのモデルを検証したんだ。

研究では、特定の時間枠での約704,000組の母子ペアの健康データを見て、ASDを予測するのに役立つ特徴を特定することに焦点を当てたんだ。例えば、子どもの出生の詳細や母親の健康歴などが挙げられるよ。

評価した特徴

研究者たちは、分娩の種類(例:帝王切開 vs 自然分娩)、出生時の体重、母親に既存の健康問題があったかどうかなど、多くの母親と子どもの特徴を考慮したんだ。ASDと診断された子どもは、男の子が多く、出生時の体重が低く、特定の健康問題を持つ母親がいる傾向があったよ。

結果の分析

この研究は、最終的な予測モデルがASDを特定するのにある程度の精度を持っていることを示したよ。パフォーマンスメトリクスでは、感度が約70.9%を示していて、そのモデルがASDの子どもを多く正しく特定できたことを意味してるんだ。ただし、モデルには限界もあって、特異度が約56.9%と低く、ASDでない子どもをリスクがあると誤って特定してしまうこともあったんだ。

医療への影響

この研究の結果は、ASDの大規模スクリーニングに似たモデルを使用する可能性を示してるよ。ASDが発症しやすい子どもを特定することで、医療提供者はこれらの子どもが必要なサポートやリソースをできるだけ早く受けられるようにできるんだ。これにより、ASDの子どもたちの結果が良くなるかもしれないね。

研究におけるバイアスへの対処

この研究は有望だけど、健康データとMLモデルを使う際のバイアスに関する課題もあるよ。ASDは男の子に多く影響を与えるため、女の子には診断されるケースが少なくなるんだ。これがモデルが女の子に対して効果的に機能しない可能性があることを意味してるよ。研究者たちは、誤分類を避けるために、自分たちのモデルを評価する際にこれらの違いを考慮することが重要だよ。

今後の方向性

将来の研究では、予測モデルの精度を高めたり、スクリーニングのための新しいデータセットを探ったりすることを目指してるよ。適切な要因が含まれていて、信頼できるデータに基づいていることが、効果的なスクリーニングツールを構築するために不可欠なんだ。最終的には、ASDの早期発見のために医療現場で使われるシステムを作ることが目標だよ。

結論

この研究は、MLモデルと健康データを使って、ASDのリスクがある幼い子どもを特定することが可能であることを示してるんだ。こうしたモデルを実装すれば、早期発見の取り組みを強化でき、評価や診断、必要な治療へのアクセスが早くなるかもしれないね。このアプローチは、ASDに影響を受ける多くの家族や個人の生活の質を改善する可能性があるよ。

オリジナルソース

タイトル: Predicting Autism Spectrum Disorder: Transformer-Based Deep Learning Ensemble Framework Using Health Administrative & Birth Registry Data

概要: BackgroundEarly diagnosis and access to resources, support and therapy are critical for improving long-term outcomes for children with autism spectrum disorder (ASD). ASD is typically detected using a case-finding approach based on symptoms and family history, resulting in many delayed or missed diagnoses. While population-based screening would be ideal for early identification, available screening tools have limited accuracy. This study aims to determine whether machine learning models applied to health administrative and birth registry data can identify young children (aged 18 months to 5 years) who are at increased likelihood of developing ASD. MethodsWe assembled the study cohort using individually linked maternal-newborn data from the Better Outcomes Registry and Network (BORN) Ontario database. The cohort included all live births in Ontario, Canada between April 1st, 2006, and March 31st, 2018, linked to datasets from Newborn Screening Ontario (NSO), Prenatal Screening Ontario (PSO), and Canadian Institute for Health Information (CIHI) (Discharge Abstract Database (DAD) and National Ambulatory Care Reporting System (NACRS)). The NSO and PSO datasets provided screening biomarker values and outcomes, while DAD and NACRS contained diagnosis codes and intervention codes for mothers and offspring. Extreme Gradient Boosting models and large-scale ensembled Transformer deep learning models were developed to predict ASD diagnosis between 18 and 60 months of age. Leveraging explainable artificial intelligence methods, we determined the impactful factors that contribute to increased likelihood of ASD at both an individual- and population-level. ResultsThe final study cohort included 703,894 mother-offspring pairs, with 10,964 identified cases of ASD. The best-performing ensemble of Transformer models achieved an area under the receiver operating characteristic curve of 69.6% for predicting ASD diagnosis, a sensitivity of 70.9%, a specificity of 56.9%. We determine that our model can be used to identify an enriched pool of children with the greatest likelihood of developing ASD, demonstrating the feasibility of this approach. ConclusionsThis study highlights the feasibility of employing machine learning models and routinely collected health data to systematically identify young children at high likelihood of developing ASD. Ensemble transformer models applied to health administrative and birth registry data offer a promising avenue for universal ASD screening. Such early detection enables targeted and formal assessment for timely diagnosis and early access to resources, support, or therapy.

著者: Christine M Armour, K. Dick, E. Kaczmarek, R. Ducharme, A. C. Bowie, A. L. J. Dingwall-Harvey, H. Howley, S. Hawken, M. C. Walker

最終更新: 2024-07-05 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2024.07.03.24309684

ソースPDF: https://www.medrxiv.org/content/10.1101/2024.07.03.24309684.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

類似の記事