Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico# Intelligenza artificiale

Nuove scoperte nella previsione della morte improvvisa

Uno studio utilizza i registri sanitari per prevedere i rischi di morte improvvisa negli anziani.

― 7 leggere min


Previsione dei rischi diPrevisione dei rischi dimorte improvvisaprevisioni di morte improvvisa.La ricerca svela fattori chiave nelle
Indice

Ogni anno, un gran numero di persone muore inaspettatamente, spesso per problemi cardiaci. Queste morti improvvise possono accadere senza alcun segnale di avviso, rendendo difficile prevedere quando potrebbero verificarsi. Molte di queste persone non avevano problemi cardiaci evidenti in precedenza, e le diverse definizioni di Morte Improvvisa aggiungono confusione. Questa difficoltà nella previsione della morte improvvisa è una preoccupazione significativa nel settore sanitario.

Per affrontare questo problema, è stato condotto uno studio utilizzando i registri sanitari elettronici (EHR) del NHS, concentrandosi su persone di età superiore ai 50 anni nell'area di Greater Glasgow. Lo studio mirava a determinare se fattori come la storia medica, l'uso di farmaci e le visite in ospedale potessero aiutare a prevedere il rischio di morte improvvisa.

I ricercatori hanno esaminato due risultati principali: la morte improvvisa e la mortalità per tutte le cause (che include decessi per qualsiasi motivo). Hanno creato sei modelli per ciascun risultato, utilizzando tre modelli sviluppati da altri ricercatori e tre nuovi modelli che hanno creato. Questi modelli hanno utilizzato diversi modi per rappresentare i dati, inclusi modelli basati sul linguaggio e matrici sparse.

Lo studio ha utilizzato metodi per capire quali caratteristiche dei dati fossero più importanti per prevedere i risultati. Questo è stato fatto raggruppando fattori correlati insieme per ridurre la complessità e confrontare meglio le prestazioni dei modelli.

Sfide nella Previsione della Morte Improvvisa

La morte improvvisa si verifica spesso in individui che potrebbero apparire in buona salute, il che rende difficile la previsione. In molti casi, le persone che subiscono morte improvvisa non mostrano alcun sintomo precedente che porterebbe normalmente a una valutazione medica o a un ricovero.

I tassi di morte improvvisa variano ampiamente perché diversi studi utilizzano diversi criteri di inclusione e definizioni. Molte morti improvvise che avvengono al di fuori degli ospedali vengono spesso registrate come infarti, ma è probabile che non tutti questi casi siano riportati accuratamente. Questa inconsistenza complica ulteriormente gli sforzi di previsione.

Sebbene gli EHR abbiano il potenziale per fornire informazioni preziose, presentano sfide. Gli EHR contengono un numero vasto di dettagli clinici raccolti nel tempo, il che può rendere difficile l'analisi con metodi statistici tradizionali. Di recente, l'apprendimento automatico è stato sempre più utilizzato nel settore sanitario per migliorare i modelli di previsione, ma il processo è ancora in fase di sviluppo. La natura degli EHR, che include eventi sporadici e irregolari, aggiunge complessità.

Importanza dell'Interpretabilità nei Modelli Sanitari

Comprendere come funzionano i modelli di previsione è cruciale per il loro utilizzo nel settore sanitario. I medici devono fidarsi di questi modelli, e input chiari possono aiutare a identificare eventuali pregiudizi nei dati. Questa comprensione può poi tradursi in informazioni utilizzabili nella presa di decisioni cliniche.

Lo studio ha incluso più modelli di apprendimento automatico all'avanguardia adattati per prevedere la morte improvvisa e eventi cardiovascolari maggiori. Questi modelli sono stati addestrati su dati raccolti da una grande popolazione di adulti più anziani che ricevevano assistenza dal NHS.

Sono state applicate tecniche di interpretabilità sia globale che locale per spiegare le previsioni dei modelli. L'interpretabilità globale aiuta a delineare l'importanza complessiva delle diverse caratteristiche, mentre l'interpretabilità locale si addentra nei dettagli dei singoli casi.

Dati Utilizzati nello Studio

La ricerca ha utilizzato registri sanitari amministrativi anonimizzati del NHS su un periodo di 12 anni per persone di età superiore ai 50 anni. L'analisi ha combinato dati demografici, storia medica, risultati di test di laboratorio, prescrizioni e cartelle cliniche.

Il focus principale era sulla morte improvvisa, definita come una morte inaspettata avvenuta al di fuori di un ospedale o entro 24 ore da un ricovero in pazienti senza malattie terminali. I ricercatori hanno anche incluso eventi cardiovascolari gravi come parte della loro definizione di morte improvvisa.

D'altra parte, la mortalità per tutte le cause significava qualsiasi morte per qualsiasi motivo, indipendentemente dalle condizioni di salute esistenti.

Metodologia dell'Analisi

Gli EHR sono stati ripuliti e processati per rimuovere incoerenze e rumore dai dati. Fattori come esami del sangue, ricoveri e prescrizioni di farmaci sono stati standardizzati per prepararli all'analisi.

Due tipi di rappresentazioni dei dati sono stati utilizzati nello studio. Uno era un modello basato sul linguaggio che trattava i registri come frasi, consentendo un'ampia codifica delle informazioni. L'altro era una rappresentazione a matrice sparsa focalizzata sulla quantificazione delle occorrenze di vari eventi medici nel tempo.

I modelli sono stati addestrati utilizzando dati campione, e la loro efficacia è stata valutata in base a quanto bene potevano prevedere la morte improvvisa e la mortalità per tutte le cause.

Costruzione del Modello

Sono stati sviluppati sei Modelli Predittivi, inclusi variazioni di modelli esistenti e modelli di nuova costruzione. Questi sono stati addestrati sui dati del NHS per valutare le loro prestazioni nella previsione della morte improvvisa e di eventi cardiovascolari gravi.

Il processo di addestramento consisteva in più iterazioni, regolando i modelli secondo necessità per migliorare le loro capacità predittive. Sono stati esaminati diversi indicatori chiave durante l'addestramento, come quanto bene ogni modello fosse in grado di identificare individui a rischio di morte improvvisa.

Valutazione del Modello e Risultati

Dopo l'addestramento, tutti i modelli sono stati valutati per le prestazioni basate su diversi indicatori predittivi. I risultati hanno mostrato che i modelli hanno funzionato meglio nel prevedere la mortalità per tutte le cause rispetto alla morte improvvisa.

I modelli hanno indicato che hanno avuto più difficoltà a identificare i casi di morte improvvisa, poiché questo gruppo includeva tipicamente individui che non avevano malattie terminali note e apparivano relativamente sani al momento della previsione.

Approfondimenti dall'Analisi dell'Importanza delle Caratteristiche

Lo studio ha individuato le caratteristiche che avevano l'impatto più significativo sulle prestazioni del modello. È stato notato che molti modelli si concentravano molto su variabili di esami del sangue e prescrizioni di farmaci mentre identificavano fattori di rischio chiave sia per la morte improvvisa che per la mortalità per tutte le cause.

I ricercatori hanno utilizzato varie metriche di interpretabilità per estrarre approfondimenti sui processi decisionali dei modelli, offrendo un quadro più chiaro su come diverse caratteristiche di input contribuissero alle previsioni.

Tecniche di Clustering per Approfondimenti

La ricerca ha applicato tecniche di clustering per comprendere meglio le relazioni tra le caratteristiche e migliorare il confronto delle previsioni tra diversi modelli. Questo approccio ha permesso di esaminare i cluster di dati dei pazienti, rivelando schemi che hanno contribuito alle prestazioni del modello.

Raggruppando caratteristiche correlate, i ricercatori sono stati in grado di migliorare l'interpretabilità dei loro modelli. Questo metodo si è dimostrato utile nella valutazione di come diversi modelli concordassero sull'importanza di varie caratteristiche nella previsione degli esiti.

Limitazioni dello Studio

Lo studio ha affrontato alcune limitazioni, inclusa la restrizione a individui di età superiore ai 50 anni. Inoltre, il dataset proveniva esclusivamente dall'area di Greater Glasgow, che potrebbe non essere rappresentativa di popolazioni più ampie.

L'accesso ad alcuni dataset esterni provenienti da altri studi era limitato, impedendo ai ricercatori di replicare direttamente alcuni modelli all'avanguardia utilizzati nelle analisi comparative. Le differenze nella qualità e granularità dei dati potrebbero influenzare i risultati.

Conclusione

In conclusione, la ricerca ha sottolineato le sfide nella previsione della morte improvvisa in individui che sembrano sani. Accanto allo sviluppo di modelli di apprendimento automatico, è stata evidenziata l'importanza di identificare chiaramente le caratteristiche chiave e comprendere le decisioni del modello.

I risultati suggeriscono la necessità di modelli di previsione del rischio più efficaci nel settore sanitario, soprattutto per la morte improvvisa, incoraggiando anche studi futuri a affrontare le limitazioni identificate e a costruire su questo lavoro.

Concentrandosi su metodologie riproducibili e chiara interpretabilità, i ricercatori possono migliorare l'affidabilità e l'applicabilità dei modelli di apprendimento automatico in contesti clinici.

Fonte originale

Titolo: Consensus of state of the art mortality prediction models: From all-cause mortality to sudden death prediction

Estratto: Worldwide, many millions of people die suddenly and unexpectedly each year, either with or without a prior history of cardiovascular disease. Such events are sparse (once in a lifetime), many victims will not have had prior investigations for cardiac disease and many different definitions of sudden death exist. Accordingly, sudden death is hard to predict. This analysis used NHS Electronic Health Records (EHRs) for people aged $\geq$50 years living in the Greater Glasgow and Clyde (GG\&C) region in 2010 (n = 380,000) to try to overcome these challenges. We investigated whether medical history, blood tests, prescription of medicines, and hospitalisations might, in combination, predict a heightened risk of sudden death. We compared the performance of models trained to predict either sudden death or all-cause mortality. We built six models for each outcome of interest: three taken from state-of-the-art research (BEHRT, Deepr and Deep Patient), and three of our own creation. We trained these using two different data representations: a language-based representation, and a sparse temporal matrix. We used global interpretability to understand the most important features of each model, and compare how much agreement there was amongst models using Rank Biased Overlap. It is challenging to account for correlated variables without increasing the complexity of the interpretability technique. We overcame this by clustering features into groups and comparing the most important groups for each model. We found the agreement between models to be much higher when accounting for correlated variables. Our analysis emphasises the challenge of predicting sudden death and emphasises the need for better understanding and interpretation of machine learning models applied to healthcare applications.

Autori: Yola Jones, Fani Deligianni, Jeff Dalton, Pierpaolo Pellicori, John G F Cleland

Ultimo aggiornamento: 2023-08-30 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2308.16067

Fonte PDF: https://arxiv.org/pdf/2308.16067

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Link di riferimento

Altro dagli autori

Articoli simili