Identificazione dei cluster di malattie nella multimorbidità
Uno studio sulla riconoscimento dei gruppi di malattie per migliorare la cura dei pazienti con multimorbilità.
― 7 leggere min
Indice
- L'importanza di identificare i cluster di malattie
- Sfide nella ricerca attuale
- Il ruolo dell'Elaborazione del linguaggio naturale
- Obiettivo dello studio
- Descrizione dei dati
- Generare incapsulamenti di malattie
- Clustering degli incapsulamenti di malattia
- Confronto con la classificazione ICD-10
- Descrivere i cluster di malattie
- Insight dai clustering basati su sequenze
- L'importanza del clustering a più risoluzioni
- Implicazioni cliniche
- Direzioni future
- Fonte originale
La Multimorbidità è quando una persona ha due o più condizioni di salute a lungo termine contemporaneamente. Questa situazione è comune e può rendere l'assistenza sanitaria più complicata sia per i pazienti che per i sistemi sanitari. Le persone con multimorbidità spesso hanno una qualità della vita inferiore, affrontano un rischio maggiore di morte, hanno bisogno di più cure mediche e sostengono costi sanitari più elevati.
L'importanza di identificare i cluster di malattie
La ricerca ha dimostrato che ci sono gruppi specifici o "cluster" di condizioni di salute che tendono a verificarsi insieme nei pazienti con multimorbidità. Riconoscere questi cluster può aiutare i professionisti della salute a capire le relazioni tra le malattie e migliorare le cure per i pazienti. Mentre alcuni cluster di malattie, come quelli legati alla sindrome metabolica, sono ben noti, altri sono ancora in fase di studio.
Con i progressi nella tecnologia e nell'analisi dei dati, i ricercatori possono ora utilizzare grandi quantità di dati sanitari per trovare questi cluster meno ovvi. Identificando come le diverse malattie siano collegate, i servizi sanitari possono essere meglio organizzati per soddisfare le esigenze dei pazienti e migliorare le opzioni di trattamento.
Sfide nella ricerca attuale
Nonostante i progressi, i metodi attuali per identificare i cluster di malattie presentano alcune lacune. Ad esempio, molti studi hanno esaminato solo un numero limitato di condizioni di salute, il che può far perdere collegamenti importanti. Inoltre, la maggior parte degli studi si concentra su un modo di raggruppare le malattie, il che può trascurare la complessità di come le malattie interagiscono.
Utilizzando nuovi approcci, come i metodi di Clustering basati su grafi, i ricercatori possono esaminare i dati da più prospettive. Questo può rivelare connessioni tra le malattie che prima erano passate inosservate.
Il ruolo dell'Elaborazione del linguaggio naturale
L'elaborazione del linguaggio naturale (NLP) è un campo dell'intelligenza artificiale che si occupa di come i computer comprendono il linguaggio umano. Recentemente, le tecniche NLP sono state applicate ai dati sanitari, aiutando ad analizzare le cartelle cliniche dei pazienti e trovare schemi nelle condizioni di salute.
Guardando al modo in cui le malattie sono registrate nelle cartelle cliniche, l'NLP può creare "incapsulamenti di malattia". Queste sono rappresentazioni matematiche che catturano come le malattie si relazionano tra loro in base alla loro occorrenza nelle cartelle cliniche. Questo nuovo approccio consente una migliore comprensione delle relazioni tra le malattie, il che può migliorare i metodi di clustering.
Obiettivo dello studio
Questo studio mira a identificare cluster di malattie utilizzando sia tecniche tradizionali che moderne. Innanzitutto, confronteremo due metodi per generare incapsulamenti di malattia: uno basato su quanto spesso le malattie si verificano insieme e un altro che tiene conto delle sequenze in cui le malattie appaiono nelle cartelle cliniche. In secondo luogo, utilizzeremo una nuova tecnica di clustering che può considerare più risoluzioni, il che significa che può esaminare i cluster di malattie da angolazioni diverse.
Descrizione dei dati
I dati utilizzati in questo studio provengono da un ampio gruppo di pazienti in Inghilterra. Oltre 15 milioni di adulti erano registrati in un database da gennaio 2015 a gennaio 2020. Di questi, circa 10,5 milioni avevano almeno due di un insieme specifico di 212 condizioni a lungo termine.
I dati includono vari dettagli sui pazienti, come età, sesso ed etnia, che sono importanti per comprendere i modelli di malattia. Abbiamo costruito due tipi di sequenze di malattie per il confronto: una che include tutti i codici di salute registrati per ogni paziente e un'altra che include solo la prima istanza di ciascuna condizione.
Generare incapsulamenti di malattie
Per creare incapsulamenti di malattia, abbiamo utilizzato due metodi. Il primo metodo ha comportato tecniche tradizionali di riduzione dimensionale, che aiutano a semplificare i dati complessi. Questo metodo si è concentrato su trovare modelli nel modo in cui le malattie co-occorrono nelle cartelle cliniche.
Abbiamo anche applicato tre diversi modelli NLP per generare ulteriori incapsulamenti. Questi modelli aiutano a catturare il contesto delle malattie in base a quanto spesso compaiono insieme nelle registrazioni. Abbiamo valutato questi modelli rispetto a un elenco curato di coppie di malattie ben stabilite per vedere quanto bene si comportassero nell'identificare relazioni note.
Clustering degli incapsulamenti di malattia
Una volta generati gli incapsulamenti di malattia, abbiamo applicato un nuovo metodo di clustering chiamato Rilevazione della Comunità Multiscala di Markov (MMCD). Questo approccio aiuta a identificare cluster di malattie a diversi livelli di risoluzione, permettendoci di vedere raggruppamenti sia fini che grossolani.
Confrontando i cluster identificati tramite MMCD con quelli creati utilizzando metodi tradizionali, abbiamo scoperto che MMCD produceva cluster più bilanciati con una migliore somiglianza tra le malattie. Questo significa che le coppie di malattie note avevano maggiori probabilità di essere raggruppate insieme in MMCD rispetto ai metodi di clustering tradizionali.
Confronto con la classificazione ICD-10
Abbiamo anche confrontato i nostri cluster di malattie identificati con le classificazioni stabilite delle malattie, come il sistema ICD-10. I risultati hanno mostrato che c'erano differenze significative tra i cluster che abbiamo identificato e la classificazione tradizionale, indicando che il modo in cui le malattie si associano nei dati del mondo reale può differire dalle tassonomie standard.
Descrivere i cluster di malattie
Dopo aver identificato i cluster, abbiamo assegnato etichette a ciascun cluster in base alle malattie incluse al suo interno. Questo aiuta a fornire una panoramica dei modelli trovati nei dati. A varie risoluzioni, abbiamo trovato cluster che contenevano raggruppamenti familiari, come quelli associati alla sindrome metabolica, all'ictus e ad altre condizioni ben stabilite.
Ad esempio, a una risoluzione più fine, abbiamo identificato cluster che includevano malattie che colpiscono persone più giovani, mentre a una risoluzione più grossolana, queste malattie erano raggruppate con quelle più comuni nelle popolazioni più anziane. Questa struttura quasi gerarchica indica come le malattie siano correlate su scale diverse.
Insight dai clustering basati su sequenze
I cluster generati dall'approccio basato su sequenze tendevano a catturare informazioni aggiuntive sulle malattie, come cause sottostanti o percorsi comuni. Ad esempio, abbiamo identificato condizioni autoimmuni che si raggruppavano separatamente in base alle loro caratteristiche specifiche.
Esaminando i cluster che utilizzavano sequenze di malattie, abbiamo trovato alcuni raggruppamenti inaspettati. Ad esempio, il cancro alla tiroide è stato collocato in cluster con altri tumori, il che potrebbe suggerire relazioni che non sono immediatamente ovvie.
L'importanza del clustering a più risoluzioni
Utilizzare un approccio a più risoluzioni consente un'analisi migliorata di come le malattie si raggruppano su scale diverse. Abbiamo scoperto che certe malattie mantenevano le loro assegnazioni di cluster attraverso diverse risoluzioni, mentre altre cambiavano, riflettendo la complessa natura delle relazioni tra le malattie.
Questo metodo mostra promesse per rivelare nuove associazioni di malattie e comprendere le complessità della multimorbidità. Mentre alcuni cluster erano facili da interpretare, altri richiedevano ulteriori indagini per comprendere appieno le relazioni tra le malattie.
Implicazioni cliniche
I cluster identificati in questo studio offrono preziose intuizioni per i fornitori di assistenza sanitaria. Riconoscendo i modelli comuni nella multimorbidità, i medici possono adattare le loro cure per meglio rispondere ai pazienti con più condizioni. Ad esempio, comprendere come certe malattie si raggruppano può aiutare nello sviluppo di piani di trattamento mirati che affrontano la natura intrecciata di questi problemi di salute.
Inoltre, i risultati evidenziano l'importanza di utilizzare dati su larga scala per informare le pratiche sanitarie. I metodi tradizionali di classificazione delle malattie potrebbero non catturare la realtà di come le condizioni di salute interagiscono nei veri pazienti. Questo studio sottolinea la necessità di adattare la nostra comprensione delle relazioni tra le malattie basandoci su dati del mondo reale.
Direzioni future
Guardando avanti, ci sono diversi modi per espandere questa ricerca. Una possibilità è quella di raggruppare i pazienti in base alle loro malattie invece di concentrarsi esclusivamente sui cluster di malattie. Questo potrebbe fornire intuizioni su come diversi profili di pazienti si collegano agli esiti di salute.
Inoltre, studi futuri potrebbero esplorare come età, sesso e fattori socioeconomici influenzano il clustering delle malattie. Stratificando i cluster in base a queste caratteristiche, i ricercatori potrebbero scoprire di più sulle connessioni tra malattie meno comuni.
In conclusione, questo studio dimostra il potenziale di combinare tecniche di clustering avanzate con dati sanitari su larga scala per migliorare la nostra comprensione della multimorbidità. Identificare cluster di malattie attraverso metodi sia tradizionali che moderni può fare luce su come le condizioni di salute interagiscono, portando infine a una migliore assistenza e gestione dei pazienti.
Titolo: Identifying multi-resolution clusters of diseases in ten million patients with multimorbidity in primary care in England
Estratto: Identifying clusters of co-occurring diseases can aid understanding of shared aetiology, management of co-morbidities, and the discovery of new disease associations. Here, we use data from a population of over ten million people with multimorbidity registered to primary care in England to identify disease clusters through a two-stage process. First, we extract data-driven representations of 212 diseases from patient records employing i) co-occurrence-based methods and ii) sequence-based natural language processing methods. Second, we apply multiscale graph-based clustering to identify clusters based on disease similarity at multiple resolutions, which outperforms k-means and hierarchical clustering in explaining known disease associations. We find that diseases display an almost-hierarchical structure across resolutions from closely to more loosely similar co-occurrence patterns and identify interpretable clusters corresponding to both established and novel patterns. Our method provides a tool for clustering diseases at different levels of resolution from co-occurrence patterns in high-dimensional electronic healthcare record data.
Autori: Thomas Beaney, J. Clarke, D. Salman, T. Woodcock, A. Majeed, P. Aylin, M. Barahona
Ultimo aggiornamento: 2023-06-30 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2023.06.30.23292080
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.06.30.23292080.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.