Trasformare la sanità con EHR-ML
EHR-ML migliora la modellazione predittiva nella sanità per risultati migliori per i pazienti.
― 10 leggere min
Indice
- L'importanza della Modellazione predittiva
- Sfide nell'utilizzo delle EHR
- Sfide nella raccolta dei dati
- Problemi di squilibrio e scalabilità
- Introduzione di EHR-ML
- Previsione del Rischio di mortalità
- Previsione della durata del soggiorno in ICU (LOS)
- Obiettivi e applicazioni di EHR-ML
- Preparazione dei dati per il machine learning
- Scelta della giusta finestra temporale per i dati
- Definizione degli esiti per la previsione
- La struttura di EHR-ML
- Valutazione e validazione dei modelli
- Analisi del design ottimale dello studio
- Efficacia di EHR-ML
- La natura user-friendly di EHR-ML
- Il futuro della modellazione predittiva nella sanità
- Fonte originale
L'intelligenza artificiale (IA) sta cambiando il modo in cui pensiamo alla sanità. Usando tecniche avanzate, l'IA ci aiuta a prevedere gli esiti dei pazienti, a scoprire le malattie prima e a creare piani di trattamento più personalizzati. Uno degli strumenti principali usati a questo scopo è chiamato Cartelle Cliniche Elettroniche (EHR), che sono versioni digitali delle cartelle cartacee dei pazienti. Le EHR ci forniscono molte informazioni preziose che l'IA può analizzare per migliorare la cura dei pazienti.
Modellazione predittiva
L'importanza dellaLa modellazione predittiva è come fare ipotesi informate su come i pazienti potrebbero rispondere ai trattamenti. Può aiutare a individuare le malattie precocemente, a definire i migliori modi per trattare i pazienti e a valutare quali pazienti sono a maggior rischio. Però, c'è la preoccupazione che quello che funziona in un contesto sanitario potrebbe non funzionare in un altro. Questo perché diversi ospedali hanno modi diversi di fare le cose e diversi tipi di informazioni sui pazienti.
Affinché l'IA nella sanità sia davvero efficace, è importante creare modelli specifici per i dati locali disponibili in ciascun ospedale. Questo significa usare le informazioni sui pazienti generate all'interno di quella specifica posizione.
Sfide nell'utilizzo delle EHR
Molti studi hanno cercato di usare le EHR in modo efficace, ma spesso affrontano sfide. Non ci sono sempre metodi standard per preparare i dati o strumenti per costruire questi modelli predittivi. Questo può portare a risultati difficili da riprodurre o confrontare. A volte, i dati possono essere molto complessi, rendendo facile commettere errori.
Per affrontare questi problemi, sono stati suggeriti alcuni framework e linee guida per condurre e condividere questi tipi di studi. Ci sono anche alcuni strumenti generali disponibili per aiutare con la modellazione predittiva, ma hanno delle limitazioni. Spesso, questi strumenti richiedono che i dati siano in un formato specifico, rendendoli meno flessibili. Un altro problema è che alcuni dei sistemi di IA usati sono troppo complessi per essere compresi facilmente dagli operatori sanitari, il che solleva preoccupazioni sul loro utilizzo.
C'è anche una mancanza di processi automatici che gestiscono tutto, dalla raccolta dei dati alla costruzione dei modelli. Questo rende difficile per gli ospedali applicare questi modelli nel loro lavoro quotidiano.
Sfide nella raccolta dei dati
Creare modelli predittivi solidi dai dati EHR non è un compito facile. Una delle sfide più grandi è capire il giusto periodo di tempo per raccogliere i dati. A volte, le previsioni hanno bisogno di informazioni raccolte solo poche ore dopo l'arrivo di un paziente, mentre altre volte, potremmo guardare l'intero soggiorno in ospedale.
Un altro problema è che potrebbero esserci pochi esempi in alcune categorie di dati, rendendo difficile prevedere alcuni esiti. Ad esempio, prevedere cosa succede ai pazienti che rimangono per molto tempo può essere più difficile se non ci sono abbastanza punti dati.
Inoltre, i dati sanitari affrontano spesso problemi di privacy e possono essere molto costosi da ottenere. È essenziale sapere quanto dato è necessario per creare modelli affidabili.
Problemi di squilibrio e scalabilità
Un'altra sfida nell'utilizzo dei dati EHR è lo squilibrio di classe. Questo accade quando alcuni esiti sono molto più comuni di altri. Ad esempio, se stiamo cercando di prevedere soggiorni in ospedale che durano oltre un certo numero di giorni, potremmo scoprire che la maggior parte dei pazienti rientra nella categoria dei soggiorni brevi. Questa distribuzione disomogenea può causare problemi durante l'addestramento dei modelli predittivi e richiede un attento bilanciamento dei dati.
Inoltre, diverse misurazioni cliniche potrebbero essere su scale diverse, come la temperatura e la frequenza cardiaca. Per risolvere questo problema, spesso standardizziamo o scaldiamo i dati, ma questo può complicare il processo di modellazione.
Le misurazioni EHR vengono registrate in momenti diversi, il che può anche creare difficoltà. Trovare il modo giusto di trasformare i dati mantenendone il significato può essere una sfida.
Introduzione di EHR-ML
Per affrontare queste questioni, presentiamo EHR-ML, uno strumento potente progettato per semplificare la modellazione predittiva. Guida gli utenti attraverso ogni fase, dalla raccolta dei dati alla costruzione dei modelli, garantendo che tutto segua pratiche definite.
Abbiamo testato EHR-ML utilizzandolo per prevedere gli esiti dei pazienti con sepsi, una condizione seria che richiede un intervento medico rapido. Ci siamo concentrati su due principali esiti: rischio di morte e durata del soggiorno in Terapia Intensiva (ICU).
Rischio di mortalità
Previsione delPer prima cosa abbiamo esaminato quanto bene potevamo prevedere il rischio di morte tra questi pazienti. Questo è un aspetto importante perché sapere quali pazienti sono a maggior rischio può aiutare gli operatori sanitari a prendere decisioni migliori riguardo al loro trattamento e allocazione delle risorse.
Tradizionalmente, sono stati usati sistemi di punteggio per misurare quanto è grave la condizione di un paziente, come SOFA e APACHE. Tuttavia, l'IA può spesso fare un lavoro migliore usando dati locali, rendendo le previsioni più accurate e pertinenti.
Previsione della durata del soggiorno in ICU (LOS)
Dopo aver esaminato il rischio di mortalità, abbiamo rivolto la nostra attenzione alla previsione di quanto tempo i pazienti sarebbero rimasti in ICU. Questa previsione può essere affrontata in diversi modi, a volte guardando semplicemente se il soggiorno di un paziente supera un certo numero di giorni o utilizzando modelli di regressione più dettagliati.
Prevedere la LOS può essere più complesso rispetto a prevedere il rischio di morte. Questo perché le differenze tra i pazienti potrebbero non essere così chiare, rendendo le previsioni più difficili.
Obiettivi e applicazioni di EHR-ML
EHR-ML mira a colmare le lacune nei modelli esistenti fornendo una piattaforma semplice che aiuta clinici e ricercatori a utilizzare i propri dati efficacemente. È creato per adattarsi a diverse esigenze e consente flessibilità per gli utenti.
Abbiamo usato due set di dati ben noti, MIMIC IV e eICU, per sviluppare e testare EHR-ML. MIMIC IV include dati da un grande ospedale, mentre eICU consiste in dati provenienti da varie Unità di Terapia Intensiva.
Estraendo informazioni rilevanti da questi set di dati, abbiamo standardizzato i dati per garantire che possano essere facilmente interpretati e confrontati. Questo facilita l'uso e l'integrazione con vari strumenti.
Preparazione dei dati per il machine learning
Il passo successivo implica preparare i dati per il machine learning. Abbiamo selezionato con cura le misurazioni più frequentemente registrate e necessarie per i nostri modelli. Questo elimina misurazioni rare che non contribuirebbero molto alle nostre previsioni.
Dopo la selezione, abbiamo formattato i dati per renderli compatibili con i compiti di machine learning. I dati EHR possono essere piuttosto dettagliati e ricchi, ma spesso pongono sfide perché gli algoritmi di machine learning richiedono che i dati siano organizzati in un modo specifico.
Per semplificare questo, abbiamo usato una combinazione di diversi metodi per riassumere i dati, riducendo il numero di caratteristiche con cui dobbiamo lavorare. Questo aiuta a gestire la complessità del set di dati mantenendo intatte le informazioni importanti.
Una volta che i dati sono strutturati, abbiamo anche affrontato eventuali valori mancanti impiegando tecniche intelligenti per colmare le lacune, assicurando che i dati siano di alta qualità per la nostra analisi.
Scelta della giusta finestra temporale per i dati
Successivamente, dovevamo determinare come impostare il periodo di raccolta dei dati, che è cruciale per fare previsioni accurate. Abbiamo definito due parametri chiave: "finestra prima" e "finestra dopo". Questo aiuta a decidere quanto passato considerare e quanto nel futuro vogliamo guardare quando facciamo previsioni.
Ad esempio, se stiamo prevedendo il rischio di mortalità due giorni dopo l'ammissione di un paziente, dobbiamo selezionare quanto dato considerare prima e dopo quel periodo.
Definizione degli esiti per la previsione
Dopo aver impostato i parametri per la raccolta dei dati, abbiamo stabilito i nostri esiti target. Per la previsione della mortalità, abbiamo usato un esito binario che indica se i pazienti sono sopravvissuti mentre erano in ICU. Per la previsione della durata del soggiorno, abbiamo considerato per quanto tempo i pazienti sono rimasti in base a determinate soglie, come 7 o 14 giorni.
La struttura di EHR-ML
EHR-ML utilizza una struttura a due livelli per fare previsioni. Al primo livello, quattro modelli diversi vengono addestrati utilizzando diversi set di caratteristiche. Ogni modello guarda ai dati in modo unico, e questa combinazione porta a previsioni più affidabili.
Questi modelli di primo livello raccolgono i loro risultati, che vengono poi utilizzati da un modello di secondo livello che elabora ulteriormente queste informazioni per finalizzare le previsioni. Questo metodo aiuta a garantire che le previsioni siano sia accurate che interpretabili, affinché i fornitori di assistenza sanitaria possano comprendere come le decisioni siano influenzate.
Valutazione e validazione dei modelli
Per vedere come stanno andando i nostri modelli, abbiamo confrontato vari metriche per valutare la loro efficacia. Abbiamo guardato a indicatori di prestazione importanti come accuratezza, precisione e richiamo per capire come ciascun modello stia performando.
Abbiamo anche confrontato il potere predittivo del nostro modello EHR-ML rispetto ai sistemi di punteggio tradizionali. Questo ci consente di vedere quanto EHR-ML sia migliore nell'identificare accuratamente i pazienti ad alto rischio.
Analisi del design ottimale dello studio
EHR-ML viene fornito con strumenti per ottimizzare il design dello studio. Questo include l'analisi dei rapporti di classe, la valutazione delle dimensioni campionarie necessarie e la prova di diverse finestre di dati.
Valutando come il modello performa sotto diverse condizioni, possiamo determinare il miglior approccio per prevedere un particolare esito. Questo offre ai ricercatori indicazioni chiare su come raccogliere e processare efficacemente i loro dati.
Efficacia di EHR-ML
Abbiamo confrontato le prestazioni di EHR-ML con modelli autonomi e abbiamo scoperto che si comporta costantemente meglio. Questo dimostra che la sua struttura unica utilizza efficacemente i punti di forza di vari modelli per produrre previsioni superiori.
Facendo questo, EHR-ML si dimostra un asset prezioso nei contesti clinici, aiutando a migliorare gli esiti dei pazienti fornendo agli operatori sanitari strumenti affidabili per prendere decisioni.
La natura user-friendly di EHR-ML
EHR-ML è progettato per essere user-friendly. È dotato di uno strumento da riga di comando per chi è più tecnico e di un portale web per utenti con meno conoscenze di programmazione. Questo rende più facile per chiunque accedere alle sue funzionalità e capacità.
Il portale web consente agli utenti di caricare i propri dati formattati e condurre analisi senza bisogno di complesse conoscenze pregresse. Questa accessibilità favorisce migliori pratiche di ricerca e supporta una gamma più ampia di utenti.
Il futuro della modellazione predittiva nella sanità
La modellazione predittiva nella sanità ha un potenziale significativo per migliorare il processo decisionale e la cura dei pazienti. Tuttavia, il campo deve ancora affrontare molte sfide che devono essere risolte.
I problemi comuni includono la dipendenza dall'intuizione per costruire modelli, l'uso di codice unici che non possono essere adattati facilmente e una mancanza di metodi standardizzati per confrontare diversi studi.
EHR-ML aiuta a risolvere molti di questi problemi creando un percorso chiaro e strutturato per gli operatori sanitari per costruire modelli affidabili. La sua flessibilità e natura open-source invitano alla collaborazione, incoraggiando continui miglioramenti e affinamenti nel campo.
Fornendo un approccio ben strutturato e facile accesso, EHR-ML mira a rendere la modellazione predittiva più efficace e affidabile, il che può portare, in ultima analisi, a migliori esiti sanitari per i pazienti.
Attraverso lo sviluppo continuo e il coinvolgimento della comunità, EHR-ML ha il potenziale per fare significativi progressi nell'analisi sanitaria, guidando efficienza e miglior cura dei pazienti.
Titolo: EHR-ML: A generalisable pipeline for reproducible clinical outcomes using electronic health records
Estratto: The healthcare landscape is experiencing a transformation with the integration of Artificial Intelligence (AI) into traditional analytic workflows. However, this advancement encounters challenges due to variations in clinical practices, resulting in a crisis of generalisability. Addressing this issue, our proposed solution, EHR-ML, offers an open-source pipeline designed to empower researchers and clinicians. By leveraging institutional Electronic Health Record (EHR) data, EHR-ML facilitates predictive modelling, enabling the generation of clinical insights. EHR-ML stands out for its comprehensive analysis suite, guiding researchers through optimal study design, and its built-in flexibility allowing for construction of robust, customisable models. Notably, EHR-ML integrates a dedicated two-layered ensemble model utilising feature representation learning. Additionally, it includes a feature engineering mechanism to handle intricate temporal signals from physiological measurements. By seamlessly integrating with our quality assurance pipelines, this utility leverages its data standardization and anomaly handling capabilities. Benchmarking analyses demonstrate EHR-MLs efficacy, particularly in predicting outcomes like inpatient mortality and the Intensive Care Unit (ICU) Length of Stay (LOS). Models built with EHR-ML outperformed conventional methods, showcasing its generalisability and versatility even in challenging scenarios such as high class-imbalance. We believe EHR-ML is a critical step towards democratising predictive modelling in health-care, enabling rapid hypothesis testing and facilitating the generation of biomedical knowledge. Widespread adoption of tools like EHR-ML will unlock the true potential of AI in healthcare, ultimately leading to improved patient care.
Autori: Sonika Tyagi, Y. Ramakrishnaiah, N. Macesic, G. Webb, A. Peleg
Ultimo aggiornamento: 2024-03-04 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.03.02.24302664
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.03.02.24302664.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.