Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem# Inteligência Artificial

Melhorando o Emparelhamento de Pacientes em Ensaios Clínicos

Aproveitando LLMs pra facilitar a recrutação de pacientes pra estudos clínicos.

― 6 min ler


Aprimorando oAprimorando oRecrutamento para EnsaiosClínicoselegibilidade dos pacientes.Usando LLMs pra melhorar a triagem de
Índice

Encontrar os pacientes certos para Ensaios Clínicos é um grande desafio pra trazer novos remédios pro mercado. Muitos ensaios têm dificuldade em inscrever participantes suficientes, o que leva a atrasos e custos mais altos. Os métodos tradicionais pra identificar candidatos potenciais envolvem muito trabalho manual, que pode levar bastante tempo. Com a maior parte das informações relevantes dos pacientes armazenadas como texto não estruturado, tipo anotações dos médicos e laudos, o processo pode ser complicado e ineficiente. Mas, os avanços na tecnologia, especialmente pelo uso de grandes modelos de linguagem (LLMs), mostram que podem melhorar esse processo.

O Problema

Recrutar pacientes elegíveis virou um grande gargalo nos ensaios clínicos. Aproximadamente um terço dos ensaios clínicos falham porque não conseguem encontrar sujeitos suficientes, com as despesas de recrutamento consumindo uma parte considerável do orçamento do ensaio. Pra os pacientes, participar dos ensaios pode dar acesso a novos tratamentos, melhor monitoramento e potencialmente melhores resultados de saúde. Mesmo assim, muitos pacientes não sabem dos ensaios que eles se qualificam, geralmente porque seus médicos não informam. Essa ignorância geralmente vem da natureza trabalhosa e demorada da triagem de elegibilidade dos pacientes.

Nos ensaios clínicos, cada potencial participante precisa atender a critérios específicos de elegibilidade, que podem ser numerosos e detalhados. Identificar esses pacientes normalmente requer que um coordenador de pesquisa clínica analise manualmente os registros eletrônicos de saúde (EHRs). Uma grande parte das informações necessárias costuma ser apresentada como texto não estruturado, dificultando o processamento automático. Por exemplo, checar a elegibilidade de um único paciente pra um ensaio de câncer de Fase III pode levar quase uma hora.

As técnicas de Processamento de Linguagem Natural (NLP) existentes têm dificuldade com textos clínicos devido à sua estrutura e terminologia únicas. Os LLMs têm o potencial de transformar como essas tarefas são realizadas, oferecendo um método mais eficiente pra combinar pacientes com ensaios.

Objetivos

Esse trabalho tem como objetivo avaliar o uso de LLMs no processo de combinação de pacientes pra ensaios clínicos. Nosso foco principal é na eficiência dessas abordagens, incluindo o tempo e custo envolvidos. Desenvolvemos um sistema que usa LLMs pra determinar se os pacientes atendem a certos Critérios de Elegibilidade com base em seu histórico médico apresentado como texto não estruturado.

Abordagem

Nosso estudo explora a aplicação de LLMs pra combinação de ensaios clínicos através de dois designs principais de sistema:

  1. O primeiro design usa todo o histórico médico do paciente como um prompt pro LLM avaliar os critérios de elegibilidade. Esse processo permite que o modelo gere avaliações com base em todas as informações disponíveis.

  2. O segundo design envolve uma abordagem em duas etapas. Primeiro, filtra as anotações do paciente pra extrair as seções mais relevantes antes de enviar apenas as partes selecionadas pro LLM pra análise.

Metodologia

Avaliação Zero-Shot

No nosso processo de avaliação inicial, usamos uma técnica zero-shot. Isso significa que instruímos o modelo a avaliar a elegibilidade dos pacientes sem nenhum treinamento adicional ou exemplos contextuais. Demos ao modelo o histórico médico completo de cada paciente e pedimos que ele avaliasse todos os critérios de uma vez usando várias estratégias de prompt.

Estratégias de Prompt

Testamos várias maneiras diferentes de estruturar os prompts pra ver qual era a mais eficiente. Usamos diferentes estratégias pra ver quão bem o LLM poderia se sair com diferentes quantidades de informação. Algumas estratégias incluíam juntar todas as anotações dos pacientes em um só prompt, enquanto outras forneciam anotações individuais separadamente.

Dados e Código

O estudo utilizou o conjunto de dados do Desafio de Seleção de Coorte n2c2 de 2018, que consistia em registros de pacientes e critérios de elegibilidade correspondentes. O conjunto de dados nos permitiu comparar o desempenho do nosso sistema baseado em LLMs com métodos existentes de combinação de pacientes.

Resultados

Nossos achados mostram que usar LLMs pra combinação de pacientes pode melhorar significativamente a eficiência e eficácia de identificar pacientes elegíveis pra ensaios clínicos.

Métricas de Desempenho

Avaliar o desempenho do modelo se baseou em várias métricas-chave, incluindo precisão, recall e pontuações F1 no geral. Essas métricas ajudaram a medir quão precisamente o modelo conseguiu determinar se os pacientes atendiam aos critérios de elegibilidade do ensaio.

Custo e Eficiência

Um dos resultados mais destacados é a redução marcante tanto no tempo quanto no custo associado à avaliação dos pacientes. Nosso sistema demonstrou que conseguia processar as avaliações de elegibilidade dos pacientes muito mais rápido do que os métodos tradicionais, reduzindo significativamente o custo geral da triagem.

Interpretabilidade

Um aspecto essencial do nosso estudo foi a interpretabilidade das decisões do modelo. Avaliamos quão bem o LLM podia explicar seu raciocínio ao determinar se um paciente atendia aos critérios de elegibilidade. Essa capacidade permite que os clínicos revisem a saída e tenham confiança nas avaliações feitas pelo modelo.

Avaliação de Clínicos

Tivemos clínicos avaliando as justificativas fornecidas pelo LLM pra cada decisão que ele tomou sobre a elegibilidade dos pacientes. Essa avaliação revelou que o modelo conseguia fornecer explicações coerentes e lógicas pra a maioria de suas previsões. Pra decisões corretas, uma alta porcentagem das racionalizações eram consideradas completamente corretas.

Limitações

Embora os resultados sejam promissores, há limitações no nosso estudo que precisam ser consideradas. O conjunto de dados usado era relativamente pequeno comparado às enormes quantidades de dados em muitos sistemas de saúde. Portanto, pra implantar esse modelo de forma eficaz em um cenário do mundo real, melhorias adicionais são necessárias.

Direções Futuras

Com os achados encorajadores desse estudo, acreditamos que há várias direções de pesquisa que podem ser exploradas ainda mais. Investigações futuras poderiam envolver o refinamento dos critérios de elegibilidade ou a melhoria do LLM pra aumentar ainda mais seu desempenho. Há um potencial significativo pros LLMs desempenharem um papel crucial no futuro da identificação de pacientes pra ensaios clínicos.

Conclusão

Resumindo, nosso trabalho destaca o potencial dos LLMs pra melhorar o processo de combinação de pacientes pra ensaios clínicos. Ao fornecer avaliações precisas a uma fração do tempo e custo tradicionalmente necessário, esses modelos podem ter um impacto significativo na pesquisa clínica. Dada a importância crítica do recrutamento de pacientes pra desenvolvimento de medicamentos, esperamos que essa pesquisa promova uma exploração mais aprofundada na aplicação de técnicas avançadas de aprendizado de máquina nas operações de ensaios clínicos.

Fonte original

Título: Zero-Shot Clinical Trial Patient Matching with LLMs

Resumo: Matching patients to clinical trials is a key unsolved challenge in bringing new drugs to market. Today, identifying patients who meet a trial's eligibility criteria is highly manual, taking up to 1 hour per patient. Automated screening is challenging, however, as it requires understanding unstructured clinical text. Large language models (LLMs) offer a promising solution. In this work, we explore their application to trial matching. First, we design an LLM-based system which, given a patient's medical history as unstructured clinical text, evaluates whether that patient meets a set of inclusion criteria (also specified as free text). Our zero-shot system achieves state-of-the-art scores on the n2c2 2018 cohort selection benchmark. Second, we improve the data and cost efficiency of our method by identifying a prompting strategy which matches patients an order of magnitude faster and more cheaply than the status quo, and develop a two-stage retrieval pipeline that reduces the number of tokens processed by up to a third while retaining high performance. Third, we evaluate the interpretability of our system by having clinicians evaluate the natural language justifications generated by the LLM for each eligibility decision, and show that it can output coherent explanations for 97% of its correct decisions and 75% of its incorrect ones. Our results establish the feasibility of using LLMs to accelerate clinical trial operations.

Autores: Michael Wornow, Alejandro Lozano, Dev Dash, Jenelle Jindal, Kenneth W. Mahaffey, Nigam H. Shah

Última atualização: 2024-04-10 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2402.05125

Fonte PDF: https://arxiv.org/pdf/2402.05125

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes