Progressi nella rilevazione del cancro ai polmoni usando le EHR
Nuovi metodi puntano a migliorare la rilevazione precoce del cancro ai polmoni tramite i registri sanitari elettronici.
― 7 leggere min
Indice
I Modelli Predittivi sono strumenti che aiutano i medici a prendere decisioni migliori su come diagnosticare e trattare le malattie. Un'area in cui questi modelli sono particolarmente utili è nella rilevazione precoce del cancro ai polmoni, soprattutto quando i medici trovano piccoli punti nei polmoni chiamati noduli polmonari. I ricercatori stanno lavorando sodo per creare modelli che possano aiutare a identificare con precisione chi è a rischio di cancro ai polmoni basandosi su questi noduli.
Costruire modelli predittivi affidabili richiede di studiare ampi gruppi di persone. Più dati hanno i ricercatori, meglio possono garantire che i loro modelli funzionino bene per un'ampia gamma di persone. Gli studi clinici prospettici, che coinvolgono il monitoraggio dei partecipanti nel tempo, hanno fornito dati utili. Tuttavia, questi studi possono essere costosi e spesso si concentrano solo su persone ad alto rischio di cancro ai polmoni. Perciò, i ricercatori si stanno rivolgendo alle cartelle cliniche elettroniche (EHR) come fonte preziosa di informazioni su una popolazione più ampia.
Raccolta dati dalle cartelle cliniche elettroniche
Usare le EHR comporta un processo in due fasi. Prima, i ricercatori devono definire condizioni sanitarie specifiche per distinguere tra pazienti con cancro ai polmoni e quelli senza. Questo processo richiede una selezione attenta dei pazienti basata sulla loro storia clinica. La seconda fase consiste nell'analizzare i dati per raccogliere informazioni rilevanti su questi pazienti nel tempo.
Una sfida nell'uso delle EHR è che non tutti i pazienti con noduli polmonari sospetti hanno una storia di cancro. I medici spesso trovano difficile determinare quanto è probabile che questi noduli siano cancerosi in pazienti senza una storia di cancro. D'altra parte, i pazienti con una diagnosi recente di cancro di solito subiscono esami più approfonditi, poiché hanno maggiori probabilità di avere noduli maligni. Per migliorare i modelli predittivi, i ricercatori si concentrano su persone con noduli polmonari indeterminati che non hanno alcuna storia recente di cancro.
Codici ICD
Il ruolo deiI codici di classificazione internazionale delle malattie (ICD) aiutano a identificare varie condizioni mediche e sono comunemente usati per scopi di fatturazione negli Stati Uniti. Tuttavia, uno dei problemi che i ricercatori devono affrontare è la mancanza di accordo su quali codici ICD utilizzare per definire un problema di salute specifico, come il cancro ai polmoni. Alcune informazioni su se un nodulo è canceroso possono trovarsi solo in dati non strutturati, come note cliniche e referti di biopsia.
Per affrontare questo, i ricercatori propongono di usare un insieme specifico di termini medici noti come SNOMED-CT per definire il cancro ai polmoni e i noduli correlati. Analizzando i tempi delle diagnosi e collegandoli ai casi identificati, i ricercatori possono creare categorie più chiare di pazienti.
Una volta raggruppati i pazienti in casi (pazienti con cancro ai polmoni) e controlli (pazienti senza cancro ai polmoni), il passo successivo è estrarre dati rilevanti. Questi dati vengono spesso ottenuti da vari studi di imaging, principalmente tomografie computerizzate (CT) toraciche. Idealmente, i ricercatori esaminerebbero più scansioni nel tempo per vedere come cambiano i noduli.
Sfide nella raccolta dei dati
Raccogliere i dati necessari è spesso costoso e richiede tempo. Le revisioni manuali delle immagini e delle note cliniche possono essere molto laboriose. Perciò, i ricercatori stanno esplorando metodi automatizzati per raccogliere informazioni sulle immagini mediche e sui dati clinici dei pazienti per rendere il processo più efficiente.
Sviluppare metodi standardizzati per raccogliere dati aiuta a garantire che i gruppi di pazienti studiati possano essere confrontati tra diverse istituzioni e aree geografiche. Tuttavia, le EHR variano da istituzione a istituzione, creando sfide uniche per l'estrazione dei dati. I ricercatori mirano a creare metodi che possano funzionare indipendentemente dalle differenze nelle strutture dei dati, permettendo loro di concentrarsi esclusivamente sui codici ICD rilevanti per il loro studio.
SPN
Coorti definite daIn questa ricerca, l'obiettivo era curare coorti di pazienti che hanno Noduli Polmonari Solitari (SPN) senza una diagnosi precedente di cancro. Una coorte è semplicemente un gruppo di individui utilizzato per uno studio. I ricercatori hanno identificato individui con SPN attraverso l'uso di codici ICD specifici e hanno stabilito criteri per l'inclusione nel loro studio. Questo ha comportato l'identificazione di casi di cancro ai polmoni sviluppati entro un arco temporale specifico dopo aver trovato gli SPN.
Per separare i casi dai controlli, i ricercatori hanno utilizzato intervalli di tempo specifici. Ad esempio, se uno SPN è rimasto stabile per tre anni, era probabile che non fosse maligno. Queste informazioni hanno aiutato a creare definizioni più chiare su quali pazienti includere nello studio.
Estrazione dei dati e garanzia di qualità
I ricercatori hanno raccolto informazioni demografiche, risultati di laboratorio e prescrizioni per i pazienti rientranti nei loro intervalli di osservazione definiti. Hanno anche svolto controlli di qualità delle scansioni CT per assicurarsi che le immagini rappresentassero accuratamente le condizioni mediche rilevanti. In questo modo, miravano a garantire che i dati raccolti fossero sia di alta qualità che pertinenti per lo studio.
Una parte critica del processo ha coinvolto la classificazione delle immagini in base al loro tempismo rispetto agli eventi di cancro ai polmoni dei pazienti. I ricercatori volevano assicurarsi di includere immagini che fornissero le informazioni più utili per comprendere la progressione della malattia.
Validazione delle coorti
Per convalidare i loro gruppi di pazienti, i ricercatori hanno confrontato i loro risultati con le informazioni di un registro dei tumori. Questo registro raccoglie dati sui pazienti diagnosticati con cancro e offre ai ricercatori un punto di riferimento più affidabile. Esaminando un campione di pazienti sia nel loro studio che nel registro, i ricercatori miravano a valutare quanto accuratamente avevano identificato casi e controlli.
Attraverso questo processo di revisione, hanno scoperto che il loro metodo era efficace nell'identificare pazienti con e senza cancro ai polmoni. Hanno riscontrato che il loro approccio proposto aveva un basso tasso di falsi positivi, il che significa che la maggior parte dei pazienti etichettati come affetti da cancro ai polmoni lo era realmente.
Risultati e scoperte
I ricercatori hanno trovato un numero significativo di soggetti unici che soddisfacevano i loro criteri per l'inclusione nello studio. Molti di questi partecipanti non avevano una storia di cancro prima di sviluppare SPN. Applicando i loro criteri di inclusione, i ricercatori hanno identificato con successo sia casi di cancro ai polmoni che controlli tra i partecipanti.
Negli studi di imaging, i ricercatori hanno raccolto migliaia di scansioni CT e verificato la loro qualità. Hanno anche categorizzato le scansioni per assicurarsi che includessero immagini più rilevanti per la diagnosi del cancro ai polmoni. Questo sforzo ha comportato una revisione attenta dei dati di imaging disponibili e la selezione solo di quelli che soddisfavano i loro standard.
Conclusione
Lo studio ha sottolineato l'importanza di usare regole ben definite sui codici ICD per curare gruppi di pazienti per la ricerca sul cancro ai polmoni. Concentrandosi sui pazienti con SPN e assicurando un'identificazione accurata di casi e controlli, i ricercatori miravano a fornire informazioni preziose nella diagnosi e nella valutazione del rischio di cancro ai polmoni.
Andando avanti, i ricercatori hanno sottolineato la necessità di considerare dati oltre le finestre di osservazione immediate quando si generano ipotesi o si sviluppano modelli predittivi. Sebbene l'approccio avesse limitazioni, ha offerto un metodo promettente per collegare le cartelle cliniche elettroniche ai risultati reali dei pazienti.
In sintesi, utilizzando le cartelle cliniche elettroniche e i sistemi di codifica standardizzati, i ricercatori sperano di migliorare la comprensione e la rilevazione del cancro ai polmoni. Il loro lavoro è un passo importante per garantire che i professionisti medici possano identificare e gestire meglio i pazienti a rischio di questa grave malattia.
Titolo: Curating Retrospective Multimodal and Longitudinal Data for Community Cohorts at Risk for Lung Cancer.
Estratto: Large community cohorts are useful for lung cancer research, allowing for the development and validation of predictive models. A robust methodology for (1) identifying lung cancer and pulmonary nodules from electronic health record (EHRs) as well as (2) associating longitudinal data with these conditions is needed to optimally curate cohorts at scale from clinical data. Both objectives present the challenge of labeling noisy multimodal data while minimizing assumptions about the data structure specific to any institution. In this study, we leveraged (1) SNOMED concepts to develop ICD-based decision rules for building a cohort that captured lung cancer and pulmonary nodules and (2) clinical knowledge to define time windows for collecting longitudinal imaging and clinical concepts. We curated three cohorts with clinical concepts and repeated imaging for subjects with pulmonary nodules from our Vanderbilt University Medical Center. Our approach achieved an estimated sensitivity 0.930 (95% CI: [0.879, 0.969]), specificity of 0.996 (95% CI: [0.989, 1.00]), positive predictive value of 0.979 (95% CI: [0.959, 1.000]), and negative predictive value of 0.987 (95% CI: [0.976, 0.994]). for distinguishing lung cancer from subjects with SPNs. This work represents a strategy for high-throughput curation of multi-modal longitudinal cohorts at risk for lung cancer from routinely collected EHRs.
Autori: Thomas Z Li, K. Xu, N. C. Chada, H. Chen, M. Knight, S. Antic, K. L. Sandler, F. Maldonado, B. Landman, T. A. Lasko
Ultimo aggiornamento: 2023-11-04 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2023.11.03.23298020
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.11.03.23298020.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.