Gestire le lacune nei dati della sanità digitale
Nuovo metodo aiuta a risolvere il problema dei dati mancanti nei registri sanitari digitali.
― 8 leggere min
Il passaggio verso la sanità digitale sta creando grandi quantità di dati quotidiani. Questi dati offrono preziose informazioni sui pazienti, che possono aiutare nella ricerca, nel miglioramento dei servizi e nel monitoraggio della salute pubblica. Tuttavia, analizzare questi dati porta con sé una serie di sfide, che sono abbastanza diverse da quelle affrontate quando si lavora con dati specificamente raccolti per la ricerca.
Un problema principale è che, man mano che la sanità diventa più digitale, i dati possono cambiare frequentemente in termini di disponibilità, formato e quali informazioni sono incluse. Questa inconsistenza può rendere difficile condurre studi a lungo termine che coinvolgono più ospedali, poiché i dati raccolti in diversi contesti potrebbero non combaciare.
Per affrontare queste questioni, alcuni ricercatori hanno suggerito strumenti per individuare cambiamenti improvvisi nei dati, mentre altri hanno cercato modi per standardizzare i dati prima di analizzarli. Anche con questi primi passi, molte sfide richiedono ancora attenzione.
Prima di tutto, i cambiamenti nei dati nel tempo potrebbero essere dovuti a nuove tecnologie o ad altri fattori. È fondamentale separare i cambiamenti causati dagli aggiornamenti tecnologici da quelli che risultano da cambiamenti nelle pratiche di cura o nei dati demografici dei pazienti.
In secondo luogo, i cambiamenti tecnologici coinvolti stanno diventando più complicati. Ad esempio, i sistemi di dati possono coinvolgere più ospedali e reparti, ciascuno con le proprie pratiche. Anche i tipi di dati analizzati stanno diventando più vari, comprese le codifiche diagnostiche, riassunti clinici, risultati di test, immagini e farmaci. Monitorare tutti questi cambiamenti solo guardando i dati visivamente richiederebbe una notevole quantità di risorse, evidenziando la necessità di un po' di automazione.
In questo studio, è stato sviluppato un nuovo metodo per gestire automaticamente i dati mancanti a causa della digitalizzazione in corso negli ospedali. La ricerca si è concentrata sui dati degli Ospedali Universitari della Grande Parigi. Lo studio ha esaminato specificamente come l'uso graduale di nuove funzionalità per la raccolta di diversi tipi di registrazioni porti a dati mancanti. Analizzando quanto rapidamente queste funzionalità sono state adottate a livello di ospedale, reparto e unità, è stata valutata l'efficacia di questo modello usando vari Indicatori di Qualità e salute.
La ricerca mirava a rispondere a queste domande:
- Possiamo modellare automaticamente la digitalizzazione graduale delle cartelle cliniche?
- Possiamo usare questo modello per compensare i dati mancanti che accompagnano questo processo quando conduciamo studi osservazionali specifici?
Processo di Ricerca
Lo studio ha ricevuto l'approvazione etica dal comitato competente. In conformità con le leggi locali, il consenso dei pazienti per questo tipo di ricerca non era richiesto. I pazienti sono stati informati sullo studio e coloro che non volevano che i loro dati fossero utilizzati sono stati esclusi.
Fonte dei Dati
Gli Ospedali Universitari della Grande Parigi comprendono 38 ospedali nella regione di Parigi, che gestiscono circa 1,5 milioni di ricoveri ogni anno. Un comune sistema di cartella clinica elettronica è stato gradualmente introdotto a partire dal 2012. I diversi tipi di dati nello studio vengono raccolti utilizzando varie funzionalità di questo sistema, come registrazioni relative ai ricoveri, visite al pronto soccorso, codici diagnostici, prescrizioni alla dimissione e relazioni di consulto. I dati vengono elaborati quotidianamente e lo studio è stato condotto a luglio 2023.
Comprendere l'Adozione delle EHR
L'implementazione del sistema di cartella clinica elettronica condivisa in questi ospedali avviene attraverso varie funzionalità, con la raccolta di ciascun tipo di dato che dipende da funzioni specifiche. Ad esempio, le funzionalità per il monitoraggio delle registrazioni di ricovero sono adottate a livello ospedaliero, mentre altre sono adottate da reparti o unità specifiche, come i pronto soccorsi o le unità di terapia intensiva.
Raccogliere dati accurati su come queste funzionalità vengono utilizzate non è stato facile, poiché attualmente non esiste una base di conoscenza centralizzata. Pertanto, è stato impiegato un metodo basato sui dati per analizzare questo. Il processo di scavo nei dati è complicato dal fatto che le nuove funzionalità possono portare a incrementi immediati dei dati disponibili, ma l'uso graduale da parte dei fornitori di assistenza può attenuare l'effetto. A volte, i dati dei sistemi precedenti vengono copiati nel nuovo sistema elettronico, complicando ulteriormente l'immagine dei dati.
Per identificare automaticamente quando le funzionalità della cartella clinica elettronica sono state adottate, abbiamo calcolato una misura di completezza per ciascuna funzionalità in ciascun sito sanitario e utilizzato funzioni a gradini per analizzare i dati nel tempo.
Sono stati utilizzati due modi per misurare la completezza, a seconda della funzionalità: uno ha esaminato la percentuale di registrazioni di ricovero con almeno un dato, mentre l'altro ha utilizzato il numero mensile di registrazioni di dati normalizzato al numero più alto registrato durante lo studio. Questa tecnica di modellazione ha aiutato a stimare la data di adozione e la stabilità media della completezza dopo quella data.
Indicatori di qualità e di salute possono essere analizzati utilizzando i dati delle Cartelle Cliniche Elettroniche per valutare la qualità dell’assistenza o per monitorare focolai di malattie. Tuttavia, i dati mancanti nel tempo possono portare a stime imprecise. Gli indicatori di qualità sono stati definiti come la percentuale mensile di ricoveri con esiti registrati, mentre gli indicatori epidemiologici erano il numero settimanale di ricoveri legati a malattie stagionali.
Analisi Statistica
I dati continui sono stati riportati come mediane e intervalli, mentre i dati categorici sono stati mostrati in numeri e percentuali. Gli indicatori di qualità e epidemiologici sono stati calcolati da una data di inizio definita fino a maggio 2022, quando alcuni problemi hanno limitato l'integrazione dei rapporti clinici.
I cambiamenti negli indicatori di qualità sono stati modellati utilizzando funzioni lineari. I coefficienti del modello e i loro intervalli di confidenza sono stati stimati mediante analisi di regressione. Sono stati discussi i cambiamenti nel tempo degli indicatori, con un focus su come la pandemia di COVID-19 ha influenzato malattie stagionali come la bronchiolite e l'influenza.
Sono stati utilizzati due metodi per l'analisi: un approccio ingenuo, che non ha considerato il processo di digitalizzazione graduale, e un nuovo approccio (metodo solo delle fonti complete) che si basava sul modello precedentemente stabilito per filtrare i dati utilizzati per valutare gli esiti.
Ci si aspettava che l'uso del metodo ingenuo mostrasse valori in aumento per gli indicatori, riflettendo il miglioramento nella rilevazione degli esiti nel tempo. Al contrario, ci si aspettava che il metodo solo delle fonti complete stabilizzasse la fonte di dati utilizzata per analizzare gli esiti, evitando risultati fuorvianti.
È stata condotta un'analisi di sensibilità per esaminare gli indicatori di qualità variando la data di inizio e performando un'analisi dei sottogruppi degli ospedali.
Modellazione dell'Adozione delle EHR
Il data warehouse per il sistema ospedaliero include registri di oltre 14 milioni di pazienti. La quantità di dati raccolti è aumentata costantemente, con differenze notevoli osservate tra le varie categorie di dati.
L'adozione delle funzionalità della cartella clinica elettronica variava a seconda del sito sanitario ed era modellata utilizzando funzioni a gradini che corrispondevano al modo in cui le funzionalità venivano integrate. Alcuni registri, come quelli relativi ai ricoveri e alle visite al pronto soccorso, mostrano un'adozione rapida, mentre altri, come i report di consulto e prescrizione, sono stati adottati più gradualmente.
Le stime di completezza per alcuni ospedali e reparti mostrano le differenze nella disponibilità dei dati man mano che vengono implementate nuove funzionalità.
Indicatori di Qualità
Lo studio ha osservato variazioni negli indicatori di qualità, confrontando i risultati degli approcci ingenuo e solo delle fonti complete in diverse date di inizio. Anche se entrambi gli approcci hanno mostrato risultati simili per alcuni indicatori, sono emerse discrepanze per altri. Il metodo ingenuo ha mostrato un aumento per alcuni indicatori di qualità nel tempo, mentre l'approccio solo delle fonti complete ha ridotto i valori poiché ha filtrato i dati per ottenere stabilità.
Questo valeva anche nell'analisi di sensibilità, che ha indicato un effetto stabilizzante dal metodo solo delle fonti complete in vari ospedali, anche se il metodo ha generalmente portato a valori più bassi per gli indicatori.
Indicatori Epidemiologici
Lo studio ha anche monitorato il numero settimanale di ricoveri per bronchiolite e influenza utilizzando entrambi gli approcci. L'impatto del COVID-19 su queste tendenze è stato identificato in entrambi i casi, ma era più difficile interpretare i risultati dal metodo ingenuo, poiché non teneva conto delle variazioni nei processi di raccolta dei dati.
Concentrandosi sul metodo solo delle fonti complete, le epidemie stagionali potrebbero essere analizzate in modo più accurato, senza le distorsioni create dalla digitalizzazione.
Conclusione
La ricerca mira a fornire un modo per superare le fluttuazioni nella qualità e disponibilità dei dati causate dal passaggio alla digitalizzazione nella sanità. Il metodo solo delle fonti complete serve a filtrare i punti dati che potrebbero distorcere i risultati a causa dell'adozione incompleta delle cartelle cliniche elettroniche.
Anche se il metodo non è una soluzione perfetta, aiuta a minimizzare l'influenza di pregiudizi che potrebbero sorgere da sistemi di dati in evoluzione. Lo studio evidenzia alcune delle sfide affrontate quando si utilizza piattaforme di dati reali, comprese le preoccupazioni per la privacy che limitano l'accesso ai dati e la necessità di coordinamento tra fornitori di dati e ricercatori.
Nonostante le sue limitazioni, questo lavoro si muove verso la creazione di strumenti e metodi per analizzare efficacemente i dati sanitari. Il panorama tecnologico in continua evoluzione richiede che la ricerca futura continui ad adattarsi e innovare per garantire una valutazione accurata dei servizi sanitari nel tempo.
Titolo: Adjusting for the progressive digitization of health records: working examples on a multi-hospital clinical data warehouse
Estratto: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSObjectivesC_ST_ABSTo propose a new method to account for time-dependent data missingness caused by the increasing digitization of health records in the analysis of large-scale clinical data. Materials and MethodsFollowing a data-driven approach we modeled the progressive adoption of a common electronic health record in 38 hospitals. To this end, we analyzed data collected between 2013 and 2022 and made available in the clinical data warehouse of the Greater Paris University Hospitals. Depending on the category of data, we worked either at the hospital, department or unit level. We evaluated the performance of this model with a retrospective cohort study. We measured the temporal variations of some quality and epidemiological indicators by successively applying two methods, either a naive analysis or a novel complete-source-only analysis that accounts for digitization-induced missingness. ResultsUnrealistic temporal variations of quality and epidemiological indicators were observed when a naive analysis was performed, but this effect was either greatly reduced or disappeared when the complete-source-only method was applied. DiscussionWe demonstrated that a data-driven approach can be used to account for missingness induced by the progressive digitization of health records. This work focused on hospitalization, emergency department and intensive care units records, along with diagnostic codes, discharge prescriptions and consultation reports. Other data categories may require specific modeling of their associated data sources. ConclusionsElectronic health records are constantly evolving and new methods should be developed to debias studies that use these unstable data sources.
Autori: Adam Remaki, B. Playe, P. J. Bernard, S. Vittoz, M. Doutreligne, G. Chatellier, E. Audureau, E. Kempf, R. Porcher, R. Bey
Ultimo aggiornamento: 2023-08-21 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2023.08.17.23294220
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.08.17.23294220.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.