Melhorando o Emparelhamento de Pacientes em Ensaios Clínicos
Aproveitando LLMs pra facilitar a recrutação de pacientes pra estudos clínicos.
― 6 min ler
Índice
Encontrar os pacientes certos para Ensaios Clínicos é um grande desafio pra trazer novos remédios pro mercado. Muitos ensaios têm dificuldade em inscrever participantes suficientes, o que leva a atrasos e custos mais altos. Os métodos tradicionais pra identificar candidatos potenciais envolvem muito trabalho manual, que pode levar bastante tempo. Com a maior parte das informações relevantes dos pacientes armazenadas como texto não estruturado, tipo anotações dos médicos e laudos, o processo pode ser complicado e ineficiente. Mas, os avanços na tecnologia, especialmente pelo uso de grandes modelos de linguagem (LLMs), mostram que podem melhorar esse processo.
O Problema
Recrutar pacientes elegíveis virou um grande gargalo nos ensaios clínicos. Aproximadamente um terço dos ensaios clínicos falham porque não conseguem encontrar sujeitos suficientes, com as despesas de recrutamento consumindo uma parte considerável do orçamento do ensaio. Pra os pacientes, participar dos ensaios pode dar acesso a novos tratamentos, melhor monitoramento e potencialmente melhores resultados de saúde. Mesmo assim, muitos pacientes não sabem dos ensaios que eles se qualificam, geralmente porque seus médicos não informam. Essa ignorância geralmente vem da natureza trabalhosa e demorada da triagem de elegibilidade dos pacientes.
Nos ensaios clínicos, cada potencial participante precisa atender a critérios específicos de elegibilidade, que podem ser numerosos e detalhados. Identificar esses pacientes normalmente requer que um coordenador de pesquisa clínica analise manualmente os registros eletrônicos de saúde (EHRs). Uma grande parte das informações necessárias costuma ser apresentada como texto não estruturado, dificultando o processamento automático. Por exemplo, checar a elegibilidade de um único paciente pra um ensaio de câncer de Fase III pode levar quase uma hora.
As técnicas de Processamento de Linguagem Natural (NLP) existentes têm dificuldade com textos clínicos devido à sua estrutura e terminologia únicas. Os LLMs têm o potencial de transformar como essas tarefas são realizadas, oferecendo um método mais eficiente pra combinar pacientes com ensaios.
Objetivos
Esse trabalho tem como objetivo avaliar o uso de LLMs no processo de combinação de pacientes pra ensaios clínicos. Nosso foco principal é na eficiência dessas abordagens, incluindo o tempo e custo envolvidos. Desenvolvemos um sistema que usa LLMs pra determinar se os pacientes atendem a certos Critérios de Elegibilidade com base em seu histórico médico apresentado como texto não estruturado.
Abordagem
Nosso estudo explora a aplicação de LLMs pra combinação de ensaios clínicos através de dois designs principais de sistema:
O primeiro design usa todo o histórico médico do paciente como um prompt pro LLM avaliar os critérios de elegibilidade. Esse processo permite que o modelo gere avaliações com base em todas as informações disponíveis.
O segundo design envolve uma abordagem em duas etapas. Primeiro, filtra as anotações do paciente pra extrair as seções mais relevantes antes de enviar apenas as partes selecionadas pro LLM pra análise.
Metodologia
Avaliação Zero-Shot
No nosso processo de avaliação inicial, usamos uma técnica zero-shot. Isso significa que instruímos o modelo a avaliar a elegibilidade dos pacientes sem nenhum treinamento adicional ou exemplos contextuais. Demos ao modelo o histórico médico completo de cada paciente e pedimos que ele avaliasse todos os critérios de uma vez usando várias estratégias de prompt.
Estratégias de Prompt
Testamos várias maneiras diferentes de estruturar os prompts pra ver qual era a mais eficiente. Usamos diferentes estratégias pra ver quão bem o LLM poderia se sair com diferentes quantidades de informação. Algumas estratégias incluíam juntar todas as anotações dos pacientes em um só prompt, enquanto outras forneciam anotações individuais separadamente.
Dados e Código
O estudo utilizou o conjunto de dados do Desafio de Seleção de Coorte n2c2 de 2018, que consistia em registros de pacientes e critérios de elegibilidade correspondentes. O conjunto de dados nos permitiu comparar o desempenho do nosso sistema baseado em LLMs com métodos existentes de combinação de pacientes.
Resultados
Nossos achados mostram que usar LLMs pra combinação de pacientes pode melhorar significativamente a eficiência e eficácia de identificar pacientes elegíveis pra ensaios clínicos.
Métricas de Desempenho
Avaliar o desempenho do modelo se baseou em várias métricas-chave, incluindo precisão, recall e pontuações F1 no geral. Essas métricas ajudaram a medir quão precisamente o modelo conseguiu determinar se os pacientes atendiam aos critérios de elegibilidade do ensaio.
Custo e Eficiência
Um dos resultados mais destacados é a redução marcante tanto no tempo quanto no custo associado à avaliação dos pacientes. Nosso sistema demonstrou que conseguia processar as avaliações de elegibilidade dos pacientes muito mais rápido do que os métodos tradicionais, reduzindo significativamente o custo geral da triagem.
Interpretabilidade
Um aspecto essencial do nosso estudo foi a interpretabilidade das decisões do modelo. Avaliamos quão bem o LLM podia explicar seu raciocínio ao determinar se um paciente atendia aos critérios de elegibilidade. Essa capacidade permite que os clínicos revisem a saída e tenham confiança nas avaliações feitas pelo modelo.
Avaliação de Clínicos
Tivemos clínicos avaliando as justificativas fornecidas pelo LLM pra cada decisão que ele tomou sobre a elegibilidade dos pacientes. Essa avaliação revelou que o modelo conseguia fornecer explicações coerentes e lógicas pra a maioria de suas previsões. Pra decisões corretas, uma alta porcentagem das racionalizações eram consideradas completamente corretas.
Limitações
Embora os resultados sejam promissores, há limitações no nosso estudo que precisam ser consideradas. O conjunto de dados usado era relativamente pequeno comparado às enormes quantidades de dados em muitos sistemas de saúde. Portanto, pra implantar esse modelo de forma eficaz em um cenário do mundo real, melhorias adicionais são necessárias.
Direções Futuras
Com os achados encorajadores desse estudo, acreditamos que há várias direções de pesquisa que podem ser exploradas ainda mais. Investigações futuras poderiam envolver o refinamento dos critérios de elegibilidade ou a melhoria do LLM pra aumentar ainda mais seu desempenho. Há um potencial significativo pros LLMs desempenharem um papel crucial no futuro da identificação de pacientes pra ensaios clínicos.
Conclusão
Resumindo, nosso trabalho destaca o potencial dos LLMs pra melhorar o processo de combinação de pacientes pra ensaios clínicos. Ao fornecer avaliações precisas a uma fração do tempo e custo tradicionalmente necessário, esses modelos podem ter um impacto significativo na pesquisa clínica. Dada a importância crítica do recrutamento de pacientes pra desenvolvimento de medicamentos, esperamos que essa pesquisa promova uma exploração mais aprofundada na aplicação de técnicas avançadas de aprendizado de máquina nas operações de ensaios clínicos.
Título: Zero-Shot Clinical Trial Patient Matching with LLMs
Resumo: Matching patients to clinical trials is a key unsolved challenge in bringing new drugs to market. Today, identifying patients who meet a trial's eligibility criteria is highly manual, taking up to 1 hour per patient. Automated screening is challenging, however, as it requires understanding unstructured clinical text. Large language models (LLMs) offer a promising solution. In this work, we explore their application to trial matching. First, we design an LLM-based system which, given a patient's medical history as unstructured clinical text, evaluates whether that patient meets a set of inclusion criteria (also specified as free text). Our zero-shot system achieves state-of-the-art scores on the n2c2 2018 cohort selection benchmark. Second, we improve the data and cost efficiency of our method by identifying a prompting strategy which matches patients an order of magnitude faster and more cheaply than the status quo, and develop a two-stage retrieval pipeline that reduces the number of tokens processed by up to a third while retaining high performance. Third, we evaluate the interpretability of our system by having clinicians evaluate the natural language justifications generated by the LLM for each eligibility decision, and show that it can output coherent explanations for 97% of its correct decisions and 75% of its incorrect ones. Our results establish the feasibility of using LLMs to accelerate clinical trial operations.
Autores: Michael Wornow, Alejandro Lozano, Dev Dash, Jenelle Jindal, Kenneth W. Mahaffey, Nigam H. Shah
Última atualização: 2024-04-10 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2402.05125
Fonte PDF: https://arxiv.org/pdf/2402.05125
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.