Avanzando la Diagnosi dei Nodi Polmonari Solitari
Migliorare la classificazione degli SPN attraverso l'uso combinato di imaging medico e dati clinici.
― 5 leggere min
Indice
I Noduli Polmonari Solitari (SPNs) possono preoccupare, dato che potrebbero essere benigni o maligni. È importante capire quali noduli sono dannosi per un trattamento efficace e per ridurre l’ansia dei pazienti. Attualmente, i metodi per distinguere tra SPNs benigni e maligni non sono molto precisi e possono portare a stress, costi e problemi di salute inutili.
Recenti progressi nel deep learning, specialmente usando immagini mediche come le scansioni CT del torace, hanno mostrato potenzialità nel classificare gli SPNs. Però, basarsi solo sulle immagini non tiene conto di altre informazioni vitali sui pazienti. Combinare diversi tipi di dati, come i registri sanitari elettronici (EHRs), potrebbe migliorare l'affidabilità della classificazione degli SPNs.
La Sfida
La sfida principale nel migliorare la diagnosi degli SPN è che vari tipi di dati medici vengono raccolti in momenti diversi e possono essere incoerenti. Per esempio, i Dati di imaging possono essere presi a intervalli diversi rispetto ai registri sanitari dei pazienti, rendendo difficile analizzarli insieme. Questa incoerenza può influire sull'efficacia di qualsiasi modello predittivo progettato per classificare gli SPNs.
Approcci Attuali
La ricerca ha dimostrato che usare insieme dati di imaging e informazioni cliniche può superare i modelli che utilizzano solo un tipo di dato. Tuttavia, la maggior parte delle strategie esistenti si è concentrata su metodi tradizionali di gestione dei registri sanitari, che non sfruttano appieno il potenziale di combinare dati provenienti da varie fonti.
Alcuni metodi precedenti hanno cercato di semplificare l'analisi media dei dati nel tempo o raggruppando osservazioni simili. Questo limita la capacità di catturare la complessità delle variazioni nella salute dei pazienti nel tempo.
Il Nostro Approccio
Per affrontare queste problematiche, il nostro approccio integra imaging ripetuto con Dati Clinici longitudinali dagli EHRs per la classificazione degli SPN. Usando un modello basato su transformer, possiamo esaminare efficacemente sia le informazioni di imaging che quelle cliniche contemporaneamente.
Trasformare i Dati
Siamo partiti da un enorme set di dati clinici che includeva vari registri sanitari, farmaci e test di laboratorio. Invece di trattare questi registri come punti statici nel tempo, li abbiamo convertiti in curve longitudinali che rappresentano la progressione della salute del paziente nel tempo. Questo ci ha permesso di ottenere un quadro più chiaro della storia di ciascun paziente.
Successivamente, abbiamo applicato l'Analisi delle Componenti Indipendenti (ICA) per identificare schemi chiave nei dati. Questi schemi, o firme cliniche, aiutano a fornire intuizioni sui problemi di salute sottostanti che possono essere collegati agli SPNs.
Utilizzare l’Imaging Medico
Oltre ai dati clinici, abbiamo anche raccolto dati di imaging dalle scansioni CT del torace. Combinando sia i dati di imaging che quelli clinici longitudinali, il nostro modello apprende da una gamma più ricca di informazioni. Questo gli consente di vedere connessioni che non sono ovvie quando si guarda solo a un tipo di dato.
Scalatura Tempo-Distanza
Il tempo gioca un ruolo importante nella diagnosi degli SPN. Le informazioni più recenti sono solitamente più rilevanti rispetto ai dati più vecchi. Abbiamo progettato il nostro modello per tenere conto del momento in cui sono stati raccolti i dati utilizzando un metodo di scalatura tempo-distanza. Questo significa che il modello pone maggiore enfasi sulle osservazioni più nuove pur considerando anche quelle più vecchie, migliorando così il processo di classificazione.
Risultati del Nostro Metodo
Abbiamo messo alla prova il nostro modello rispetto a diversi altri metodi, inclusi quelli che si basavano esclusivamente su dati di imaging o clinici. I nostri risultati hanno mostrato che il nostro approccio ha superato significativamente questi metodi. Ad esempio, quando abbiamo valutato un set di SPNs impegnativi, il nostro modello ha ottenuto un punteggio AUC (Area Sotto la Curva) di 0.824, rispetto a 0.752 per i metodi migliori precedenti. Questo dimostra che il nostro modello è migliore nel classificare accuratamente gli SPNs.
Analisi di Riclassificazione
Un aspetto importante della nostra valutazione era vedere quanto bene il nostro modello potesse categorizzare i Livelli di rischio per i pazienti con SPNs. Abbiamo diviso i pazienti in categorie a rischio basso, medio e alto basandoci sulle loro probabilità previste. Il nostro modello è stato più efficace nel riclassificare correttamente i pazienti rispetto ad altri metodi esistenti.
Per i soggetti di controllo, il nostro modello ha identificato e riclassificato correttamente molti casi che altri metodi non sono riusciti a riconoscere. Questa capacità di classificare meglio le situazioni a rischio può portare a decisioni cliniche migliori e a risultati più favorevoli per i pazienti.
Discussione
In generale, la nostra ricerca dimostra che integrare immagini mediche con firme cliniche interpretabili può migliorare notevolmente la classificazione degli SPN. Il miglioramento sostanziale rispetto alle tecniche esistenti suggerisce che c'è un grande potenziale nell'adottare un approccio completo all'analisi dei dati medici.
Anche se il nostro metodo è promettente, è importante assicurarsi che questi modelli siano calibrati correttamente per un uso pratico in un contesto clinico. I modelli che abbiamo utilizzato sono stati valutati su dati che i medici avrebbero trovato difficili, il che convalida ulteriormente la loro efficacia.
Conclusione
Combinare più tipi di dati può migliorare significativamente l'interpretazione di casi medici complessi come i noduli polmonari solitari. Sfruttando tecniche moderne di machine learning, possiamo creare strumenti diagnostici più accurati che sintetizzano sia i dati di imaging che quelli clinici. Questo potrebbe portare a risultati migliori per la salute, a ridurre l'ansia per i pazienti e a migliorare complessivamente la gestione degli SPNs.
Direzioni Future
Guardando avanti, c'è ancora una sfida nell'acquisire set di dati multimodali longitudinali completi. Il nostro studio rappresenta un passo verso il superamento di questa limitazione e speriamo di vedere ulteriori ricerche in quest'area. Combinare varie fonti di dati può aprire la strada a decisioni sanitarie migliori e a un miglioramento della cura dei pazienti.
Con l'evoluzione dei metodi di integrazione delle immagini con i registri sanitari, possiamo aspettarci ulteriori progressi nella modellazione predittiva. Questo potrebbe portare a strategie più raffinate che tengono conto del contesto più ampio della salute del paziente, supportando infine i clinici nei loro processi decisionali.
Titolo: Longitudinal Multimodal Transformer Integrating Imaging and Latent Clinical Signatures From Routine EHRs for Pulmonary Nodule Classification
Estratto: The accuracy of predictive models for solitary pulmonary nodule (SPN) diagnosis can be greatly increased by incorporating repeat imaging and medical context, such as electronic health records (EHRs). However, clinically routine modalities such as imaging and diagnostic codes can be asynchronous and irregularly sampled over different time scales which are obstacles to longitudinal multimodal learning. In this work, we propose a transformer-based multimodal strategy to integrate repeat imaging with longitudinal clinical signatures from routinely collected EHRs for SPN classification. We perform unsupervised disentanglement of latent clinical signatures and leverage time-distance scaled self-attention to jointly learn from clinical signatures expressions and chest computed tomography (CT) scans. Our classifier is pretrained on 2,668 scans from a public dataset and 1,149 subjects with longitudinal chest CTs, billing codes, medications, and laboratory tests from EHRs of our home institution. Evaluation on 227 subjects with challenging SPNs revealed a significant AUC improvement over a longitudinal multimodal baseline (0.824 vs 0.752 AUC), as well as improvements over a single cross-section multimodal scenario (0.809 AUC) and a longitudinal imaging-only scenario (0.741 AUC). This work demonstrates significant advantages with a novel approach for co-learning longitudinal imaging and non-imaging phenotypes with transformers. Code available at https://github.com/MASILab/lmsignatures.
Autori: Thomas Z. Li, John M. Still, Kaiwen Xu, Ho Hin Lee, Leon Y. Cai, Aravind R. Krishnan, Riqiang Gao, Mirza S. Khan, Sanja Antic, Michael Kammer, Kim L. Sandler, Fabien Maldonado, Bennett A. Landman, Thomas A. Lasko
Ultimo aggiornamento: 2023-06-29 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2304.02836
Fonte PDF: https://arxiv.org/pdf/2304.02836
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.