大腸癌予測:データからの新しい洞察
研究が早期大腸がん診断の重要な予測因子を明らかにした。
Samantha H Y Ip, H. Harrison, J. Usher-Smith, M. E. Barclay, J. Tyrer, J. Dennis, X. Yang, M. Lush, C. Renzi, N. Pashayan, S. Denaxas, G. Lyratzopoulos, A. C. Antoniou, A. M. Wood
― 1 分で読む
大腸癌(CRC)は、大腸と直腸に影響を与えるがんの一種だよ。これは、全世界で3番目に多いがんで、今後もさらに増える見込み。早期に診断されると、生存率はかなり良くなるよ。例えば、イギリスで早期に診断された患者の5年生存率は91%なんだ。逆に、遅い段階で診断された場合の生存率はたった11%しかない。残念ながら、CRCの半分以上はすでに進行した段階で見つかってしまう。
多くの患者は診断前にCRCの症状を示すんだ。診断された人の約90%が、家庭医に行ったときに症状を経験している。ただ、これらの患者の約5人に1人は緊急治療が必要になってしまう。CRCのスクリーニングは早期診断に役立ち、生存率も改善するけど、コストや医師が特定の検査を実施できるかによって制限がある。
患者ケアを改善するために、CRCの診断可能性を予測するモデルがあると役立つかも。このモデルは、症状を示す患者をいつ紹介するか医師が判断する手助けになるし、高リスクの人を早く見つけてスクリーニングを受けさせるのにも役立つ。
大腸癌のリスク要因
いくつかの個別の要因がCRCのリスクを高めるんだ。年齢やライフスタイルといった個人的な特性や、遺伝的要因が含まれる。特に多因子スコア(PGS)などの遺伝的予測因子は、病気のリスクに関する貴重な洞察を提供できるよ。
医療システムは、遺伝情報を含むがんリスク評価を使い始めてる。例えば、他のがんタイプ用に設計されたモデルが、ヘルスケア環境での広範な使用のためにテストされている。患者の症状、検査結果、医療履歴を含む電子健康記録も、ヘルスケア環境で簡単に利用できるリスク評価ツールの開発に役立つんだ。それぞれの患者に関する新しい情報に基づいてリスクの継続的なモニタリングが可能になる。
いくつかのCRCリスク予測モデルは、遺伝と医療履歴の情報を使っているけど、長期の電子健康記録データと遺伝的要因を短期診断に完全に組み合わせたものはまだない。この研究は、そのギャップを埋めることを目的としてる。
研究の詳細
この研究では、イギリスに住む40~69歳の健康情報の大規模なコレクションであるUK Biobankのデータを使用した。このデータベースには、50万人以上の情報が含まれているんだ。参加者は詳細な人口統計情報、医療履歴、ライフスタイルの選択、血液サンプルを提供した。遺伝データは、約49万人の個人に利用可能で、多くの人に対して主治医記録がリンクされてる。
正確な結果を保証するために、研究者は遺伝データと主治医記録が利用可能な個人のみを含めた。バイアスを避けるために参加者の家族はランダムに除外された。また、研究前にがんと診断された人も除外されている。
方法論
この研究では、参加者の年齢に基づいてデータをグループに整理し、40歳から74歳の間のさまざまなマイルストーンを見た。特定の年齢グループに含まれるためには、生存していて、6ヶ月以上の継続的な健康記録があり、40歳の誕生日前にがんと診断されていない必要があった。このアプローチにより、参加者は年齢が上がるにつれて複数の年齢グループに含まれることができた。
研究者は、全国がん登録から新しいCRCの症例に関する情報を収集し、年齢マイルストーンの翌2年以内にCRCと診断された症例としてマークした。
リスク予測因子の特定
候補予測因子は、CRCの確立されたリスク要因、既存のリスクモデルのレビュー、専門家からの意見に基づいて選ばれた。家族歴や喫煙など、一部の予測因子は参加者の基準評価からすでに得られていた。いくつかの変数にはデータが欠けていたが、研究者はデータの整合性を保つためにこれらのギャップを管理した。
予測因子は、分析のために6つのカテゴリにグループ化された:コアリスク要因(人口統計と喫煙など)、遺伝スコア、CRCに関連する症状、医療履歴、血液検査結果、その他のライフスタイル要因。それぞれのグループがCRCリスクの全体的理解に貢献することを目指している。
症状の定義
「症状があるサブコホート」は、研究内で年齢マイルストーンの2年前に主治医記録に記録されたCRCに関連する症状のある個人を特定することで定義された。研究者は、新たな痔や直腸出血などの特定の症状を見て、このグループを特定した。
モデルの開発と検証
研究者たちは、年齢マイルストーンの翌2年以内にCRC診断を予測するモデルを開発した。統計モデルを使用して重要な予測因子を選び、モデルがCRCを発症する可能性のある人とそうでない人を区別する能力を評価した。
研究者はまた、それぞれの予測因子がモデルの全体的なパフォーマンスにどう貢献したかを調査し、個別および組み合わせた予測因子セットのパフォーマンスに特に注目した。これにより、CRCリスクを予測するのに最も有用な因子を評価する助けになった。
研究の結果
参加者の中で、症状があると特定された人の数がかなり多かった。症状があるグループと全体の研究コホート、症状があるサブコホートの特徴にはいくつかの違いが見られ、例えば、症状がある人の方が平均年齢が高く、喫煙歴がある可能性が高かった。
研究では、いくつかの予測因子が特にCRCの強い指標であることが分かった。例えば、鉄欠乏性貧血や直腸出血はCRC診断と高い関連があった。特に遺伝スコアもCRC発症の可能性と有意な関連があった。
モデルの性能
開発されたモデルは、研究グループ内でのCRC予測に成功した。このモデルがCRCを発症する可能性のある人とそうでない人を区別する全体的な能力はしっかりしていた。コアの人口統計と一般的な血液検査を組み合わせると、予測能力が最も良くなることが示された。これらの情報は特に価値があるんだ。
興味深いことに、症状はある程度の予測力を示したけど、モデル全体への貢献は比較的小さかった。これは、参加者の間でいくつかの症状の発生率が低かったためかもしれない。
ライフスタイル情報
研究では、基準評価中に収集されたライフスタイル要因も考慮された。しかし、これらの要因は、特に症状があるグループではモデルの予測能力にはほとんど寄与しなかった。
研究の強みと限界
この研究は、データを効果的に分析するために革新的な方法を使用した。フレームワークは、時間をかけた患者データの包括的な分析を可能にした。大規模で整理されたUK Biobankは、研究に十分なデータを提供し、貴重なリソースとなった。
それでも限界はある。UK Biobankは、特に民族的多様性に関して、一般人口を正確に代表していない可能性がある。収集されたデータは、記録方法が異なるため、すべての健康問題を捉えられないかもしれない。さらに、糞便免疫化学検査のような新しい検査は含まれておらず、結果に影響を与えた可能性がある。
結論
この研究は、大腸癌に関する理解を深めるのに貢献していて、さまざまな予測因子が高リスクの個人を特定するのにどれだけ役立つかを示している。遺伝スコアや主治医記録、特に一般的な血液検査の重要な影響は、医療におけるより良いリスク評価ツールの必要性を強調しているよ。ただし、いくつかのライフスタイル要因が含まれていたが、それは小さな役割しか果たしていなかったので、リソースはより影響力のある予測因子に集中させた方が良いかもしれない。
全体として、この研究の方法や発見は、既存のデータを効果的に活用して大腸癌患者の早期発見や結果を改善する方法について、さらなる調査を刺激するかもしれない。
タイトル: Genetics, primary care records and lifestyle factors for short-term dynamic risk prediction of colorectal cancer: prospective study of asymptomatic and symptomatic UK Biobank participants
概要: ObjectivesTo quantify the contributions of polygenic scores, primary care records (presenting symptoms, medical history and common blood tests) and lifestyle factors, for short-term risk prediction of colorectal cancer (CRC) in both all and symptomatic individuals. DesignProspective cohort study. SettingUK Biobank with follow-up until 2018. ParticipantsAll participants with linked primary care records (n=160,507), and a subcohort of participants with a recent (last two years) presentation of a symptom associated with CRC (n=42,782). Main outcome measuresOutcome was the first recorded CRC diagnosis within two years. Dynamic risk models with time-varying predictors were derived in a super-landmark framework. Contributions to model discrimination were quantified using novel inclusion-order-agnostic Shapley values of Harrels C-index using cross-validation. ResultsC-indices [95% CIs] were 0.73 [0.72-0.73] and 0.69 [0.68-0.70] for the models derived in all and symptomatic participants respectively. The Shapley contributions to model discrimination [95% CIs] differed between the two groups of participants for different predictors: 33% [25%-42%] (34% [9%-75%] in the symptomatic participants) for core predictors (e.g., age, sex, smoking), 16% [8%-26%] (8% [-21%-35%]) for polygenic scores, 32% [19%-43%] (41% [16%-73%]) for primary care blood tests, 11% [4%-17%] (9% [-25%-37%]) for primary care medical history, 6% [0%-11%] (-5% [-32%-13.4%]) for additional lifestyle factors and 3% [-2%-7%] (13% [-19%-41%]) for symptoms. ConclusionsPolygenic scores contribute substantially to short-term risk prediction for CRC in both general and symptomatic populations; however, the contribution of information in primary care records (including presenting symptoms, medical history and common blood tests) is greater. There is, however, only a small contribution by the additional lifestyle risk factors which are not routinely collected in primary care.
著者: Samantha H Y Ip, H. Harrison, J. Usher-Smith, M. E. Barclay, J. Tyrer, J. Dennis, X. Yang, M. Lush, C. Renzi, N. Pashayan, S. Denaxas, G. Lyratzopoulos, A. C. Antoniou, A. M. Wood
最終更新: 2024-08-26 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2023.12.21.23300244
ソースPDF: https://www.medrxiv.org/content/10.1101/2023.12.21.23300244.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。