Nuovo sistema NLP migliora la raccolta dei dati sull'esofago di Barrett
Un nuovo sistema NLP migliora l'estrazione dei dati per l'esofago di Barrett, aiutando a fornire una migliore assistenza ai pazienti.
― 6 leggere min
Indice
- Importanza della Monitoraggio dell'Esofago di Barrett
- La Sfida di Raccogliere Dati sui Pazienti
- Il Ruolo del Natural Language Processing
- Sviluppo di un Nuovo Sistema di NLP
- Costruzione della Pipeline di NLP
- Misurazione dell'Efficacia del Sistema di NLP
- Metriche di Qualità delle Cure
- Potenziale Futuro dell'NLP in Medicina
- Conclusioni
- Fonte originale
L'adenocarcinoma esofageo (EAC) è un tipo di cancro che è in aumento negli Stati Uniti dagli anni '70. Nonostante i progressi nella diagnosi e nel trattamento di questo cancro, soprattutto grazie a controlli regolari e terapie, le possibilità di sopravvivere cinque anni dopo la diagnosi rimangono basse, sotto al 25%. Un fattore chiave in questa situazione è una condizione chiamata Esofago di Barrett (BE), che può portare all'EAC. L'esofago di Barrett si verifica quando le cellule che rivestono l'esofago cambiano da cellule normali a un tipo chiamato cellule cilindriche.
Importanza della Monitoraggio dell'Esofago di Barrett
L'esofago di Barrett è considerato un precursore dell'EAC. Le linee guida mediche negli Stati Uniti raccomandano controlli e trattamenti specifici per i pazienti con esofago di Barrett, soprattutto per quelli che mostrano segni di cambiamenti cellulari che potrebbero portare al cancro. Nonostante queste linee guida, molti medici non le seguono costantemente, il che potrebbe comportare opportunità mancate per un intervento precoce. Inoltre, anche se sono stati suggeriti alcuni modi per misurare la qualità delle cure in questi casi, ottenere dati accurati dai registri medici è una sfida.
La Sfida di Raccogliere Dati sui Pazienti
I pazienti con esofago di Barrett spesso sottoposti a numerose endoscopie nel corso della loro vita. Durante queste procedure, i medici prendono appunti che possono contenere moltissime informazioni, ma analizzare questi dati non è facile. Gli attuali sistemi di fatturazione non offrono dettagli sufficienti per aiutare ad automatizzare l'estrazione di informazioni mediche importanti riguardanti l'esofago di Barrett. I precedenti sistemi di codifica non sono stati in grado di fornire sufficiente granularità e possono confondere diagnosi precedenti con quelle attuali.
Di conseguenza, i medici devono spesso rivedere manualmente i registri per raccogliere le informazioni necessarie, un processo che richiede tempo e può portare a errori. Questo è particolarmente vero quando si cerca di valutare l'efficacia del trattamento o la qualità delle cure.
Il Ruolo del Natural Language Processing
Le recenti innovazioni tecnologiche, come il Natural Language Processing (NLP), mostrano potenzialità nel migliorare il modo in cui raccogliamo informazioni dai registri medici. L'NLP può migliorare l'accuratezza e l'efficienza dell'estrazione dei dati per condizioni simili, come il cancro al colon, ma ci sono meno studi focalizzati sull'esofago di Barrett. Alcuni sistemi di NLP esistenti hanno utilizzato una combinazione di metodi basati su regole per estrarre pezzi chiave di informazione, ma solo uno si concentra specificamente sull'esofago di Barrett e ha un ambito limitato.
Sviluppo di un Nuovo Sistema di NLP
Per affrontare queste sfide, i ricercatori hanno creato un nuovo sistema di NLP progettato per estrarre automaticamente una varietà di dati clinici importanti legati ai trattamenti per l'esofago di Barrett. Questo sistema va oltre l'identificazione delle diagnosi; traccia anche l'efficacia dei trattamenti e i risultati dei pazienti.
Il team ha raccolto dati da un database clinico in un importante centro medico, concentrandosi sui pazienti che avevano subito endoscopie relative all'esofago di Barrett. Hanno raccolto dati sia strutturati che non strutturati, inclusi appunti fatti dai medici durante queste procedure. Questa raccolta dati completa è fondamentale per sviluppare un efficace sistema di NLP.
Costruzione della Pipeline di NLP
Per creare la pipeline di NLP, i ricercatori hanno selezionato un gruppo di pazienti per determinare quali diagnosi e trattamenti avessero ricevuto. Medici esperti hanno esaminato i registri medici per confermare queste informazioni e generare un insieme di diagnosi, che includevano variazioni da nessun esofago di Barrett a diversi livelli di displasia (un segno precoce di cancro) e cancro conclamato.
Il sistema di NLP ha quindi valutato referti patologici e note di trattamento per identificare informazioni rilevanti. Ogni nota è stata elaborata per filtrare i dati non necessari e concentrarsi su ciò che contava di più. Il sistema ha utilizzato elaborazione del testo avanzata per garantire un'estrazione accurata dei concetti medici legati all'esofago di Barrett.
Misurazione dell'Efficacia del Sistema di NLP
Nei test con il nuovo sistema di NLP, i ricercatori hanno trovato un'alta precisione nell'identificare le diagnosi e i trattamenti dei pazienti. Hanno confrontato le prestazioni del sistema con i registri esaminati manualmente e hanno scoperto che poteva estrarre informazioni affidabili sui risultati dei pazienti. Questo includeva il monitoraggio di quando i pazienti iniziavano il trattamento e l'efficacia di quei trattamenti nel tempo.
Utilizzando il sistema di NLP, i ricercatori hanno identificato con successo eventi clinici chiave, come quando il trattamento è iniziato e quando i pazienti non mostravano più evidenza di displasia o esofago di Barrett. Questa capacità è essenziale per valutare la qualità delle cure fornite ai pazienti con esofago di Barrett.
Metriche di Qualità delle Cure
Grazie al nuovo sistema di NLP, i ricercatori sono stati in grado di generare statistiche importanti riguardanti il trattamento dell'esofago di Barrett. Sono stati in grado di monitorare quanti pazienti hanno subito trattamenti specifici e valutare il tempo complessivo necessario per raggiungere tappe significative nella loro cura, come la bonifica della displasia o della metaplasia intestinale.
I risultati hanno indicato che una percentuale notevole di pazienti che hanno subito trattamenti per l'esofago di Barrett aveva diagnosi, durate di trattamento e risultati variabili. Queste informazioni possono aiutare i fornitori di assistenza sanitaria a valutare le proprie pratiche e fare miglioramenti quando necessario.
Potenziale Futuro dell'NLP in Medicina
Questa nuova pipeline di NLP rappresenta un significativo progresso nel modo in cui i professionisti medici possono monitorare e analizzare dati relativi all'esofago di Barrett e all'EAC. Anche se l'attuale sistema basato su regole offre vantaggi specifici, c'è potenziale per sviluppi futuri che utilizzino tecniche di machine learning più avanzate. Queste potrebbero rendere il sistema ancora più adattabile, riducendo la dipendenza da regole complesse per l'estrazione di informazioni rilevanti.
Il successo iniziale di questo sistema di NLP incoraggia ulteriori esplorazioni delle sue applicazioni per altre condizioni mediche. Con la ricerca in corso nel deep learning e la sua capacità di analizzare dati non strutturati, le possibilità di migliorare l'estrazione di dati sanitari sembrano promettenti.
Conclusioni
L'avvento di questo nuovo sistema di NLP sottolinea la necessità di metodi migliorati per raccogliere e analizzare dati sui pazienti nel contesto dell'esofago di Barrett e dell'EAC. Questo lavoro evidenzia l'importanza della ricerca e dello sviluppo continuo nella tecnologia medica, poiché questi progressi potrebbero portare a migliori risultati per i pazienti e a pratiche sanitarie più efficienti. L'automazione dell'estrazione e dell'analisi dei dati può supportare notevolmente i fornitori di assistenza sanitaria nel prendere decisioni informate sulla cura dei pazienti.
Titolo: Natural Language Processing Can Automate Extraction of Barrett's Esophagus Endoscopy Quality Metrics
Estratto: ObjectivesTo develop an automated natural language processing (NLP) method for extracting high-fidelity Barretts Esophagus (BE) endoscopic surveillance and treatment data from the electronic health record (EHR). MethodsPatients who underwent BE-related endoscopies between 2016 and 2020 at a single medical center were randomly assigned to a development or validation set. Those not aged 40 to 80 and those without confirmed BE were excluded. For each patient, free text pathology reports and structured procedure data were obtained. Gastroenterologists assigned ground truth labels. An NLP method leveraging MetaMap Lite generated endoscopy-level diagnosis and treatment data. Performance metrics were assessed for this data. The NLP methodology was then adapted to label key endoscopic eradication therapy (EET)-related endoscopy events and thereby facilitate calculation of patient-level pre-EET diagnosis, endotherapy time, and time to CE-IM. Results99 patients (377 endoscopies) and 115 patients (399 endoscopies) were included in the development and validation sets respectively. When assigning high-fidelity labels to the validation set, NLP achieved high performance (recall: 0.976, precision: 0.970, accuracy: 0.985, and F1-score: 0.972). 77 patients initiated EET and underwent 554 endoscopies. Key EET-related clinical event labels had high accuracy (EET start: 0.974, CE-D: 1.00, and CE-IM: 1.00), facilitating extraction of pre-treatment diagnosis, endotherapy time, and time to CE-IM. ConclusionsHigh-fidelity BE endoscopic surveillance and treatment data can be extracted from routine EHR data using our automated, transparent NLP method. This method produces high-level clinical datasets for clinical research and quality metric assessment. Study Highlights1) WHAT IS KNOWN: - Existing BE clinical data extraction methods are limited. 2) WHAT IS NEW HERE: - An NLP pipeline for granular BE clinical data.
Autori: Ali Soroush, C. J. Diamond, H. M. Zylberberg, B. May, N. Tatonetti, J. A. Abrams, C. Weng
Ultimo aggiornamento: 2023-07-13 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2023.07.11.23292529
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.07.11.23292529.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.