Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio

Valutare l'estrazione del supporto sociale dalle note cliniche

Lo studio confronta sistemi basati su regole e modelli linguistici per estrarre dati di supporto sociale.

― 6 leggere min


Studio di Estrazione DatiStudio di Estrazione Datisul Supporto Socialenelle note cliniche.Valutata la performance dei sistemi NLP
Indice

Il Supporto sociale e l'Isolamento sociale sono fattori importanti che influenzano la salute. Spesso sono inclusi nelle note cliniche piuttosto che essere registrati in modo ordinato nelle banche dati. Questo rende difficile per i medici e i ricercatori trovare e usare queste informazioni. L'elaborazione del linguaggio naturale (NLP) è una tecnologia che aiuta a estrarre automaticamente questo tipo di informazioni dal testo, rendendo il processo più facile e veloce.

Studio Scopo

Questo studio ha lo scopo di scoprire quanto bene due sistemi diversi possano estrarre informazioni sul supporto sociale e sull'isolamento sociale dalle note cliniche. Un sistema si basa su regole specifiche, mentre l'altro utilizza un modello linguistico ampio. Confrontando questi due sistemi, l'obiettivo è vedere quale funziona meglio in diversi contesti.

Dati e Metodi

Il team di ricerca ha raccolto note cliniche da due centri medici: il Mount Sinai Health System e la Weill Cornell Medicine. Un totale di 525 note di incontri psichiatrici sono state etichettate con attenzione per creare uno standard per misurare le prestazioni. Il sistema basato su regole ha usato parole e frasi specifiche per cercare istanze di supporto sociale e isolamento, mentre il modello linguistico ha utilizzato un approccio più flessibile basato sulla sua formazione.

Risultati

I risultati hanno mostrato che il sistema basato su regole era più efficace nell'identificare sia il supporto sociale che l'isolamento sociale rispetto al modello linguistico. Ad esempio, il sistema basato su regole ha ottenuto un punteggio più alto in entrambi i centri medici. Questo è stato sorprendente, dato che i modelli linguistici spesso performano meglio in compiti simili.

Discussione

Le differenze nelle prestazioni possono essere attribuite al modo in cui ciascun sistema opera. Il sistema basato su regole ha seguito da vicino le linee guida stabilite per l'annotazione, portando a risultati più accurati. Al contrario, il modello linguistico era più inclusivo e a volte ha classificato erroneamente i termini a causa della sua comprensione più ampia del linguaggio.

Importanza del Supporto Sociale e dell'Isolamento

Il supporto sociale si riferisce all'aiuto e al conforto che le persone ricevono da amici, familiari e comunità. Livelli più alti di supporto sociale sono legati a risultati di salute migliori, sia fisica che mentale. D'altra parte, l'isolamento sociale può portare a gravi problemi di salute, inclusi problemi di salute mentale e mortalità aumentata. È fondamentale per i professionisti della salute comprendere questi fattori sociali per una migliore pianificazione del trattamento e cura dei pazienti.

Ricerca Precedente

La maggior parte degli studi precedenti sul supporto sociale e sull'isolamento si basa su sondaggi, che possono essere limitati in portata e dimensione. C'è stata meno attenzione nell'estrarre queste informazioni dalle note cliniche reali. Questa ricerca punta a colmare quella lacuna utilizzando strumenti NLP per analizzare i EHR, che contengono informazioni preziose sulle situazioni sociali dei pazienti.

Sfide nell'Estrazione dei Dati

L'estrazione di dati dalle note cliniche presenta sfide a causa del linguaggio vario usato dai medici e della mancanza di dati strutturati. I metodi tradizionali spesso richiedono uno sforzo manuale, che richiede tempo. L'NLP può automatizzare questo processo, ma l'efficacia dipende dal sistema utilizzato.

Approcci all'Estrazione dei Dati

Esistono tre metodi principali per estrarre supporto sociale e isolamento dai dati clinici:

  1. Sistemi basati su regole: Questo implica l'uso di un elenco di parole e regole per trovare menzioni rilevanti nel testo. Può essere preciso ma richiede molto sforzo per creare e mantenere le regole.

  2. Modelli di Apprendimento Automatico: Questi sistemi richiedono grandi quantità di dati etichettati per formarsi efficacemente. Possono essere utili ma spesso non performano altrettanto bene rispetto ai sistemi basati su regole.

  3. Modelli Linguistici Ampi (LLMs): Questi sono modelli avanzati che possono generare testo simile a quello umano. Possono imparare da grandi quantità di dati e possono eseguire vari compiti con poco affinamento. Tuttavia, possono agire come una "scatola nera", rendendo difficile comprendere il loro processo decisionale.

Il Ruolo dei Lessici

Per sviluppare un sistema basato su regole, i ricercatori hanno prima creato un lessico di termini relativi al supporto sociale e all'isolamento. Hanno esaminato le note cliniche per identificare parole e frasi che rappresentano accuratamente questi concetti. Questo lessico è stato cruciale per il successo del sistema.

Processo di annotazione

Per creare uno standard di riferimento per misurare le prestazioni, i ricercatori hanno annotato le note cliniche con categorie specifiche di supporto sociale e isolamento. Hanno seguito linee guida rigide per garantire coerenza nell'etichettatura.

Valutazione dei Sistemi

Entrambi i sistemi sono stati valutati in base alla loro capacità di classificare accuratamente le istanze di supporto sociale e isolamento. Il sistema basato su regole ha costantemente superato il modello linguistico in vari parametri, il che è stato inaspettato data la percezione comune degli LLM come superiori.

Confronti con Codici Esistenti

Lo studio ha anche esaminato quanto bene questi sistemi si confrontassero con pratiche di codifica esistenti come i codici ICD. Nessuna delle note cliniche valutate aveva codici ICD corrispondenti per isolamento sociale, sottolineando l'importanza dei sistemi NLP per identificare questi fattori.

Conclusione

Lo studio ha dimostrato con successo i punti di forza e di debolezza di entrambi i metodi basati su regole e modelli linguistici per estrarre supporto sociale e isolamento dalle note cliniche. Il sistema basato su regole ha mostrato una migliore accuratezza, il che è particolarmente importante per gli ambienti clinici dove la precisione è cruciale. Entrambi i sistemi possono essere adattati e resi disponibili per altri ricercatori e fornitori di assistenza sanitaria.

Direzioni Future

C'è ancora molto lavoro da fare per migliorare questi sistemi, specialmente per quanto riguarda il perfezionamento dell'accuratezza del modello linguistico. La ricerca futura si concentrerà sul rendere i sistemi più portabili tra diversi contesti sanitari. La validazione continua e gli aggiornamenti ai lessici e alle regole saranno anche essenziali per garantire efficacia.

Riepilogo

In sintesi, questa ricerca evidenzia l'importanza del supporto sociale e dell'isolamento nella salute mentale e mostra il potenziale dell'NLP nel convertire informazioni cliniche non strutturate in dati utili. Migliorando i modi in cui estraiamo queste informazioni, i professionisti della salute possono comprendere e affrontare meglio i fattori sociali che influenzano la salute dei pazienti.

Punti Chiave

  • Il supporto sociale e l'isolamento influenzano significativamente i risultati di salute.
  • I metodi tradizionali di raccolta dei dati sono spesso limitati.
  • L'NLP può automatizzare l'estrazione di importanti fattori sociali dalle note cliniche.
  • I sistemi basati su regole attualmente superano i modelli linguistici in accuratezza per questo compito.
  • I risultati possono aiutare a migliorare la pianificazione del trattamento e la cura dei pazienti.
Fonte originale

Titolo: Extracting Social Support and Social Isolation Information from Clinical Psychiatry Notes: Comparing a Rule-based NLP System and a Large Language Model

Estratto: Background: Social support (SS) and social isolation (SI) are social determinants of health (SDOH) associated with psychiatric outcomes. In electronic health records (EHRs), individual-level SS/SI is typically documented as narrative clinical notes rather than structured coded data. Natural language processing (NLP) algorithms can automate the otherwise labor-intensive process of data extraction. Data and Methods: Psychiatric encounter notes from Mount Sinai Health System (MSHS, n=300) and Weill Cornell Medicine (WCM, n=225) were annotated and established a gold standard corpus. A rule-based system (RBS) involving lexicons and a large language model (LLM) using FLAN-T5-XL were developed to identify mentions of SS and SI and their subcategories (e.g., social network, instrumental support, and loneliness). Results: For extracting SS/SI, the RBS obtained higher macro-averaged f-scores than the LLM at both MSHS (0.89 vs. 0.65) and WCM (0.85 vs. 0.82). For extracting subcategories, the RBS also outperformed the LLM at both MSHS (0.90 vs. 0.62) and WCM (0.82 vs. 0.81). Discussion and Conclusion: Unexpectedly, the RBS outperformed the LLMs across all metrics. Intensive review demonstrates that this finding is due to the divergent approach taken by the RBS and LLM. The RBS were designed and refined to follow the same specific rules as the gold standard annotations. Conversely, the LLM were more inclusive with categorization and conformed to common English-language understanding. Both approaches offer advantages and are made available open-source for future testing.

Autori: Braja Gopal Patra, Lauren A. Lepow, Praneet Kasi Reddy Jagadeesh Kumar, Veer Vekaria, Mohit Manoj Sharma, Prakash Adekkanattu, Brian Fennessy, Gavin Hynes, Isotta Landi, Jorge A. Sanchez-Ruiz, Euijung Ryu, Joanna M. Biernacka, Girish N. Nadkarni, Ardesheer Talati, Myrna Weissman, Mark Olfson, J. John Mann, Alexander W. Charney, Jyotishman Pathak

Ultimo aggiornamento: 2024-03-25 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2403.17199

Fonte PDF: https://arxiv.org/pdf/2403.17199

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili