Migliorare il matching dei pazienti nei trial clinici
Sfruttare i LLM per semplificare la reclutamento dei pazienti per le sperimentazioni cliniche.
― 6 leggere min
Indice
Trovare i pazienti giusti per le sperimentazioni cliniche è una grande sfida quando si tratta di lanciare nuovi farmaci sul mercato. Tante prove faticano a reclutare abbastanza partecipanti idonei, portando a ritardi e costi maggiori. I metodi tradizionali per identificare i candidati potenziali richiedono un sacco di lavoro manuale, il che può richiedere un bel po' di tempo. Con la maggior parte delle informazioni pertinenti sui pazienti memorizzate come testo non strutturato, tipo appunti dei medici e referti di laboratorio, il processo può risultare complicato e inefficiente. Tuttavia, i progressi nella tecnologia, in particolare attraverso l'uso di modelli di linguaggio di grandi dimensioni (LLM), mostrano promettente nel migliorare questo processo.
Il Problema
Reclutare abbastanza pazienti idonei è diventato un grande collo di bottiglia nelle sperimentazioni cliniche. Circa un terzo delle sperimentazioni cliniche fallisce perché non riescono a trovare abbastanza soggetti idonei, con le spese di reclutamento che consumano una buona parte del budget dello studio. Per i pazienti, partecipare alle prove può fornire accesso a nuovi trattamenti, monitoraggio migliore e potenzialmente migliori risultati di salute. Nonostante questo, tanti pazienti rimangono all'oscuro delle sperimentazioni per cui sono idonei, spesso perché i loro medici non li informano. Il motivo di questa ignoranza spesso deriva dalla natura laboriosa e dispendiosa in termini di tempo dello screening di idoneità dei pazienti.
Nelle sperimentazioni cliniche, ogni partecipante potenziale deve soddisfare specifici Criteri di idoneità, che possono essere numerosi e dettagliati. Identificare questi pazienti di solito richiede che un coordinatore di ricerca clinica esamini manualmente i registri sanitari elettronici (EHR). Una grande parte delle informazioni necessarie è solitamente presentata come testo non strutturato, rendendo difficile l'elaborazione automatica. Ad esempio, controllare un singolo paziente per una sperimentazione clinica di Fase III per il cancro può richiedere quasi un'ora.
Le tecniche esistenti di Elaborazione del linguaggio naturale (NLP) hanno faticato con il testo clinico a causa della sua struttura e terminologia uniche. Gli LLM hanno il potenziale di trasformare il modo in cui vengono svolti questi compiti, fornendo un metodo più efficiente per abbinare i pazienti alle sperimentazioni.
Obiettivi
Questo lavoro ha come obiettivo valutare l'uso degli LLM nel processo di abbinamento dei pazienti per le sperimentazioni cliniche. Il nostro focus principale è sull'Efficienza di questi approcci, incluso il tempo e i costi coinvolti. Abbiamo sviluppato un sistema che utilizza gli LLM per determinare se i pazienti soddisfano determinati criteri di idoneità basati sulla loro storia clinica presentata come testo non strutturato.
Approccio
Il nostro studio esplora l'applicazione degli LLM per l'abbinamento nella sperimentazione clinica attraverso due principali design di sistema:
Il primo design utilizza l'intera storia medica del paziente come input per l'LLM per valutare i criteri di idoneità. Questo processo consente al modello di generare valutazioni basate su tutte le informazioni disponibili.
Il secondo design prevede un approccio in due fasi. Prima filtra gli appunti del paziente per estrarre le sezioni più rilevanti, prima di inviare solo le parti selezionate all'LLM per l'analisi.
Metodologia
Valutazione Zero-Shot
Nel nostro processo iniziale di valutazione, abbiamo impiegato una tecnica zero-shot. Questo significa che abbiamo istruido il modello a valutare l'idoneità dei pazienti senza alcun ulteriore addestramento o esempi contestuali. Abbiamo fornito al modello l'intera storia medica di ciascun paziente e gli abbiamo chiesto di valutare tutti i criteri in una volta usando varie strategie di prompting.
Strategie di Prompting
Abbiamo testato diversi modi di strutturare i prompt per determinare quale fosse il più efficiente. Abbiamo usato diverse strategie per vedere quanto bene l'LLM potesse eseguire quando gli venivano forniti quantità diverse di informazioni. Alcune strategie includevano la fusione di tutti gli appunti dei pazienti in un solo prompt, mentre altre fornivano note individuali separatamente.
Dati e Codice
Lo studio ha utilizzato il dataset della sfida n2c2 Cohort Selection del 2018, composto da registrazioni di pazienti e criteri di idoneità corrispondenti. Il dataset ci ha permesso di confrontare le performance del nostro sistema basato su LLM con i metodi esistenti di abbinamento dei pazienti.
Risultati
I nostri risultati dimostrano che utilizzare gli LLM per l'abbinamento dei pazienti può migliorare significativamente l'efficienza e l'efficacia nell'identificare pazienti idonei per le sperimentazioni cliniche.
Metriche di Performance
Abbiamo valutato la performance del modello basandoci su diverse metriche chiave, tra cui precisione, richiamo e punteggi F1 complessivi. Queste metriche hanno aiutato a misurare quanto accuratamente il modello fosse in grado di determinare se i pazienti soddisfacevano i criteri di idoneità richiesti per la sperimentazione.
Costi e Efficienza
Uno dei risultati più notevoli è la notevole riduzione sia del tempo che del costo associati alla valutazione dei pazienti. Il nostro sistema ha dimostrato di poter elaborare le valutazioni di idoneità dei pazienti molto più rapidamente rispetto ai metodi tradizionali, riducendo significativamente il costo complessivo dello screening.
Interpretabilità
Un aspetto essenziale del nostro studio è stata l'interpretabilità delle decisioni del modello. Abbiamo valutato quanto bene l'LLM potesse spiegare il suo ragionamento quando determinava se un paziente soddisfacesse i criteri di idoneità. Questa capacità consente ai clinici di esaminare l'output e avere fiducia nelle valutazioni effettuate dal modello.
Valutazione del Clinico
Abbiamo fatto valutare ai clinici le giustificazioni fornite dall'LLM per ogni decisione presa riguardo all'idoneità del paziente. Questa valutazione ha rivelato che il modello poteva fornire spiegazioni coerenti e logiche per la maggior parte delle sue predizioni. Per le decisioni corrette, una percentuale elevata delle giustificazioni è stata considerata completamente corretta.
Limitazioni
Anche se i risultati sono promettenti, ci sono limitazioni nel nostro studio che devono essere considerate. Il dataset utilizzato era relativamente piccolo rispetto alle enormi quantità di dati presenti in molti sistemi sanitari. Pertanto, per implementare efficacemente questo modello in un contesto reale, sono necessari ulteriori miglioramenti.
Direzioni Future
Con i risultati incoraggianti di questo studio, crediamo che ci siano numerose direzioni di ricerca che possono essere esplorate ulteriormente. Le indagini future potrebbero coinvolgere il perfezionamento dei criteri di idoneità o l'ottimizzazione dell'LLM per migliorare ulteriormente le sue performance. C'è un potenziale significativo affinché gli LLM giochino un ruolo cruciale nel futuro dell'identificazione dei pazienti per le sperimentazioni cliniche.
Conclusione
In sintesi, il nostro lavoro evidenzia il potenziale degli LLM nel migliorare il processo di abbinamento dei pazienti per le sperimentazioni cliniche. Fornendo valutazioni accurate in una frazione del tempo e del costo tradizionalmente richiesti, questi modelli possono avere un impatto significativo nella ricerca clinica. Data l'importanza critica del reclutamento dei pazienti per lo sviluppo dei farmaci, speriamo che questa ricerca promuova ulteriori esplorazioni sull'applicazione di tecniche avanzate di apprendimento automatico nelle operazioni di sperimentazione clinica.
Titolo: Zero-Shot Clinical Trial Patient Matching with LLMs
Estratto: Matching patients to clinical trials is a key unsolved challenge in bringing new drugs to market. Today, identifying patients who meet a trial's eligibility criteria is highly manual, taking up to 1 hour per patient. Automated screening is challenging, however, as it requires understanding unstructured clinical text. Large language models (LLMs) offer a promising solution. In this work, we explore their application to trial matching. First, we design an LLM-based system which, given a patient's medical history as unstructured clinical text, evaluates whether that patient meets a set of inclusion criteria (also specified as free text). Our zero-shot system achieves state-of-the-art scores on the n2c2 2018 cohort selection benchmark. Second, we improve the data and cost efficiency of our method by identifying a prompting strategy which matches patients an order of magnitude faster and more cheaply than the status quo, and develop a two-stage retrieval pipeline that reduces the number of tokens processed by up to a third while retaining high performance. Third, we evaluate the interpretability of our system by having clinicians evaluate the natural language justifications generated by the LLM for each eligibility decision, and show that it can output coherent explanations for 97% of its correct decisions and 75% of its incorrect ones. Our results establish the feasibility of using LLMs to accelerate clinical trial operations.
Autori: Michael Wornow, Alejandro Lozano, Dev Dash, Jenelle Jindal, Kenneth W. Mahaffey, Nigam H. Shah
Ultimo aggiornamento: 2024-04-10 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2402.05125
Fonte PDF: https://arxiv.org/pdf/2402.05125
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.