Prevedere i cambiamenti nella funzione polmonare nei pazienti con SSc-ILD usando il machine learning
Questo studio esplora come il machine learning può prevedere i cambiamenti nella funzione polmonare nella SSc-ILD.
― 7 leggere min
Indice
- Metodi Correnti per Monitorare la Malattia Polmonare
- Progressi nella Predizione della Progressione della Malattia
- Come il Machine Learning Può Aiutare
- Il Nostro Contributo
- Raccolta Dati dai Pazienti
- Comprendere le Traiettorie dei Pazienti
- Analizzando le Caratteristiche dei Pazienti
- Modelli di Progressione della Malattia
- Misurazione dell'Accuratezza delle Previsioni
- Incertezza nelle Previsioni
- Importanza delle Caratteristiche nelle Previsioni
- Importanza della Documentazione dei Trattamenti
- Conclusione
- Fonte originale
La Sclerosi Sistemica (SSc) è una malattia a lungo termine che colpisce il sistema immunitario e danneggia i vasi sanguigni. Può portare a cambiamenti nel modo in cui vari organi e tessuti funzionano nel corpo. Un problema serio che può sorgere dalla SSc è una condizione chiamata Malattia Polmonare Interstiziale (ILD). L'ILD si verifica quando si accumula troppo tessuto cicatriziale nei polmoni, rendendo difficile per i pazienti respirare. Questo può peggiorare col tempo ed è una ragione comune per visite in ospedale e decessi tra le persone con SSc.
Poiché l'ILD è un grosso problema per chi ha la SSc, controlli regolari sono essenziali. I dottori monitorano attentamente la funzione polmonare per individuare tempestivamente eventuali cambiamenti. Questo processo prevede generalmente di fare immagini dettagliate dei polmoni e test per valutare come stanno funzionando.
Metodi Correnti per Monitorare la Malattia Polmonare
Attualmente, i dottori usano la tomografia computerizzata ad alta risoluzione (HRCT) del torace per vedere quanto i polmoni siano colpiti. Fanno anche test di funzionalità polmonare (PFT) per valutare la salute dei polmoni. Metodi di analisi di nuova sviluppo che guardano le informazioni raccolte dalle scansioni HRCT hanno mostrato promesse nel prevedere quanto a lungo i pazienti con SSc-ILD potrebbero vivere senza seri problemi di salute.
Un altro studio ha mostrato che alcune misurazioni, come la capacità vitale forzata (FVC) e la capacità dei polmoni di trasferire gas (DLCO), possono indicare come sta progredendo l'ILD nei singoli pazienti. Tuttavia, ogni paziente è diverso, e alcuni sperimentano una progressione della malattia più veloce di altri, portando a rischi maggiori di complicazioni. Capire come cambia la funzione polmonare di ogni paziente nel tempo è cruciale per fornire la migliore cura.
Progressi nella Predizione della Progressione della Malattia
I ricercatori hanno cercato segni o marcatori che possono aiutare a prevedere come progredirà l'SSc-ILD. Alcuni studi hanno identificato alcuni potenziali marcatori che potrebbero aiutare nelle previsioni della progressione della malattia. Ad esempio, alcuni ricercatori hanno sviluppato un modello predittivo basato su quanto bene cammina un paziente e se ha certi problemi alle articolazioni. Altri studi hanno trovato fattori diversi, come essere maschi o non aver preso aspirina prima, che potrebbero essere legati a come progredisce la malattia.
Nonostante questi progressi, non c'è ancora un modo definitivo per prevedere come progredirà l'ILD a livello individuale. Non c'è nemmeno accordo su quanto spesso i pazienti dovrebbero essere sottoposti a screening o sui migliori metodi per farlo.
Le diverse scoperte potrebbero essere dovute a differenze nei gruppi di pazienti studiati. Inoltre, molti di questi studi hanno utilizzato tecniche di analisi standard che potrebbero non catturare la complessità dei dati. Con il progresso della tecnologia, il machine learning (ML) è emerso come uno strumento potente. Aiuta a estrarre informazioni utili da grandi set di dati, che possono offrire migliori spunti sulla cura dei pazienti.
Come il Machine Learning Può Aiutare
I metodi di machine learning possono analizzare informazioni complesse e aiutare nella presa di decisioni. Ad esempio, i ricercatori hanno utilizzato con successo il ML per prevedere lo sviluppo di malattie oculari analizzando dati genetici e di imaging. Hanno anche utilizzato il ML per identificare pazienti a rischio di malattie cardiache valutando l'evoluzione delle placche nei vasi sanguigni. Metodi simili possono essere applicati all'SSc-ILD per prevedere come cambierà la funzione polmonare nel tempo.
Il Nostro Contributo
In questo studio, ci siamo concentrati sulla previsione dei futuri valori della funzione polmonare nei pazienti con SSc-ILD utilizzando il machine learning. Abbiamo creato cronologie per ogni paziente, raccogliendo informazioni dalle loro visite e preservando l'ordine degli eventi. Ci siamo posti diversi obiettivi principali:
- Sviluppare un nuovo modello specificamente progettato per comprendere i cambiamenti nella funzione polmonare nei pazienti con SSc-ILD.
- Confrontare il nostro nuovo modello con vari modelli ML standard per valutarne l'accuratezza.
- Analizzare come certi fattori possano influenzare l'accuratezza delle nostre previsioni.
- Testare un metodo che migliori l'incertezza nelle previsioni.
- Determinare quali caratteristiche hanno avuto un ruolo significativo nelle previsioni del nostro modello.
Raccolta Dati dai Pazienti
Abbiamo utilizzato un ampio database che contiene informazioni da migliaia di pazienti. Questo database include dettagli sulla loro salute, demografia e dati clinici su più visite. Per la nostra analisi, abbiamo incluso pazienti che soddisfacevano criteri specifici, come essere adulti con diagnosi di ILD confermata da test di imaging, che avevano registrato misurazioni della funzione polmonare e avevano fatto più visite in clinica.
Comprendere le Traiettorie dei Pazienti
Abbiamo organizzato i dati raccolti in cronologie dei pazienti, permettendoci di vedere come la condizione di ogni paziente si sia evoluta nel tempo. Ogni visita ha contribuito a un quadro più chiaro della salute e della funzione polmonare del paziente. L'obiettivo era utilizzare le visite passate per prevedere i futuri risultati della funzione polmonare.
Analizzando le Caratteristiche dei Pazienti
Il nostro gruppo di studio finale era composto da oltre 2000 pazienti, la maggior parte dei quali donne, con un'età media di circa 53 anni. I dati mostrano una varietà di caratteristiche, tra cui età, genere e abitudini di fumo. Queste caratteristiche hanno aiutato a fornire ulteriore contesto per comprendere la salute di ciascun paziente.
Modelli di Progressione della Malattia
Utilizzando i dati della cronologia, ci siamo concentrati sulla previsione dei risultati futuri per i pazienti basandoci sulle loro visite precedenti. Abbiamo impiegato diverse tecniche di modellazione, tra cui:
- Reti Neurali Ricorrenti (RNN): Questo tipo di modello è eccellente per gestire dati sequenziali come le cronologie dei nostri pazienti.
- Reti Transformer: Un altro modello avanzato che può evidenziare l'importanza di diversi fattori nelle previsioni.
- Processi Neurali Attenti (ANP): Questo modello è progettato per apprendere dai dati in modo efficiente e fornire stime di incertezza per le sue previsioni.
Misurazione dell'Accuratezza delle Previsioni
Abbiamo utilizzato vari metodi per valutare quanto bene i nostri modelli abbiano performato in termini di accuratezza. Una delle misure chiave è stata l'Errore Quadratico Medio (RMSE), che ci ha aiutato a capire quanto le previsioni fossero vicine ai risultati reali. Abbiamo anche valutato come diversi fattori influenzassero le previsioni.
Incertezza nelle Previsioni
Capendo che le previsioni potrebbero non essere sempre accurate, abbiamo esaminato come i nostri modelli potessero fornire stime di incertezza. Ad esempio, abbiamo valutato quanto fosse probabile che la funzione polmonare reale rientrasse in un certo intervallo previsto. Questa stima dell'incertezza è importante per i dottori per prendere decisioni informate sulla cura del paziente.
Importanza delle Caratteristiche nelle Previsioni
Abbiamo analizzato quali caratteristiche erano più influenti nelle nostre previsioni. Questa analisi ha rivelato che le misurazioni precedenti della funzione polmonare e fattori come l'estensione del coinvolgimento cutaneo, l'età e alcuni dettagli clinici hanno avuto ruoli significativi. Questi spunti possono aiutare i clinici a capire quali fattori dovrebbero monitorare attentamente nei pazienti.
Importanza della Documentazione dei Trattamenti
Una scoperta notevole è stata l'importanza di una documentazione accurata dei trattamenti. Abbiamo osservato che man mano che il livello di documentazione della terapia aumentava, le previsioni dei modelli miglioravano. Questo sottolinea la necessità di una registrazione accurata nella sanità per aiutare a formare modelli predittivi più efficaci in futuro.
Conclusione
La nostra ricerca dimostra il potenziale dell'uso di tecniche avanzate di machine learning per prevedere i cambiamenti nella funzione polmonare nei pazienti con SSc-ILD. I risultati hanno mostrato che i modelli sequenziali hanno superato i metodi standard, fornendo spunti accurati sulle traiettorie dei pazienti. Questo approccio non solo migliora la nostra comprensione di come la malattia possa progredire, ma fornisce anche strumenti preziosi per i fornitori di assistenza sanitaria per gestire e trattare i pazienti in modo più efficace. Prevedendo accuratamente i futuri esiti di salute, possiamo prendere decisioni più informate nella cura dei pazienti, migliorando infine la qualità della vita per coloro che vivono con SSc-ILD.
Titolo: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study
Estratto: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.
Autori: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators
Ultimo aggiornamento: 2024-04-26 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.