Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem

Melhorando o Recrutamento para Ensaios Clínicos de Câncer com Ferramentas de PNL

Modelos de PLN ajudam a identificar os critérios de elegibilidade para ensaios clínicos de câncer.

Yumeng Yang, Peter Krusche, Kristyn Pantoja, Cheng Shi, Ethan Ludmir, Kirk Roberts, Gen Zhu

― 7 min ler


Ferramentas de PLN emFerramentas de PLN emEnsaios de Câncercâncer.recrutados para testes clínicos deNLP melhora como os pacientes são
Índice

O Câncer afeta muita gente, causando altas taxas de doença e morte. Só nos EUA, foram quase 1,9 milhão de novos casos de câncer e mais de 600 mil mortes em 2022. Ensaios Clínicos desempenham um papel crucial no desenvolvimento de novos tratamentos e medicamentos para o câncer. No entanto, fazer os pacientes participarem desses ensaios pode ser difícil. Muitos pacientes se preocupam com os riscos de novos tratamentos ou não recebem informações completas sobre os ensaios. Além disso, pode ser complicado encontrar os ensaios certos porque as regras sobre quem pode participar geralmente são escritas em uma linguagem complexa, que é difícil de entender para quem não está na área médica.

A Importância dos Critérios de Elegibilidade

Todo ensaio clínico tem um protocolo, que é como um plano detalhado que inclui os objetivos, o design, os métodos e as regras do ensaio. Os critérios de elegibilidade são uma parte crítica desse plano, pois definem quem pode participar. Esses critérios geralmente incluem requisitos sobre o que os pacientes precisam ter (critérios de inclusão) e o que pode excluí-los (critérios de exclusão).

O ClinicalTrials.gov é um site público onde as informações sobre ensaios clínicos nos EUA são listadas. Ele começou a exigir o registro de ensaios em 2007. Até o começo de 2023, cerca de meio milhão de estudos estavam registrados. Essa riqueza de informações é útil para pesquisa, incluindo o estudo de tendências ao longo do tempo, a compreensão de diferentes populações envolvidas em ensaios e o desenvolvimento de ferramentas que ajudam na Recrutamento de pacientes.

Desafios na Recrutamento

Encontrar pacientes elegíveis para ensaios clínicos pode levar muito tempo e esforço. Um grande problema é que os critérios de elegibilidade muitas vezes não são escritos em um formato consistente. Essa inconsistência pode confundir tanto os pacientes quanto seus médicos, causando atrasos no recrutamento. Há uma necessidade crescente de ferramentas automáticas para ajudar a identificar esses critérios de forma rápida e precisa.

Processamento de Linguagem Natural (PLN) é um campo da ciência da computação que foca na interação entre computadores e linguagem humana. O PLN tem muitas aplicações na saúde, como extrair e organizar informações de dados textuais, como critérios de elegibilidade e registros de pacientes. Usando ferramentas de PLN, é possível criar sistemas que identificam automaticamente os requisitos importantes para ensaios clínicos, facilitando o processo de recrutamento para pacientes e profissionais de saúde.

Nosso Projeto

Nosso objetivo é criar classificadores que identifiquem critérios de exclusão chave nas descrições de elegibilidade de ensaios de câncer encontrados no ClinicalTrials.gov. Desenvolvemos nosso próprio modelo baseado em estruturas existentes de PLN, usando mais de meio milhão de seções de critérios de elegibilidade desse banco de dados. Os resultados do nosso modelo serão comparados com outros modelos existentes para avaliar seu desempenho.

Trabalhos Relacionados em Mineração de Texto

Vários projetos trabalharam anteriormente para facilitar a busca e organização de critérios de elegibilidade para ensaios clínicos. Por exemplo, o Criteria2Query é uma ferramenta que converte descrições complexas de elegibilidade em consultas mais simples que podem ajudar a identificar pacientes elegíveis. O DQueST é outro projeto que fornece um questionário para ajudar indivíduos a encontrar ensaios apropriados.

Outras ferramentas existem para estruturar critérios de elegibilidade ou extrair informações relevantes que combinam registros de pacientes com os requisitos dos ensaios. Alguns esforços focam em criar bases de conhecimento, bancos de dados ou léxicos que categorizam critérios de elegibilidade comuns. Exemplos incluem os projetos EliIE e Chia, que fornecem coleções de ensaios anotados para doenças específicas.

Coleta de Dados e Processo de Anotação

Para nosso estudo, coletamos 764 ensaios clínicos de câncer do ClinicalTrials.gov, focando em ensaios de 2000 a 2017. Cada ensaio foi anotado por profissionais médicos usando um cuidadoso processo de revisão em dupla para garantir precisão. Focamos em identificar sete critérios principais que são importantes para ensaios de câncer:

  • Câncer anterior
  • Status do HIV
  • Status do HBV
  • Status do HCV
  • Doença psiquiátrica
  • Uso de drogas e álcool
  • Condições autoimunes

Dividimos o texto de elegibilidade de cada ensaio em sentenças para ajudar o modelo a identificar melhor os critérios. Essa etapa foi necessária porque muitos modelos existentes só conseguem lidar com uma quantidade limitada de texto de cada vez, e sentenças mais curtas são mais fáceis para o modelo processar.

Correspondência de Palavras-chave

Para encontrar sentenças relevantes, criamos uma lista de palavras-chave para cada um dos sete critérios. Matchando essas palavras-chave no texto, extraímos sentenças que continham as informações mais cruciais. Esse processo ajuda o modelo a aprender como classificar sentenças com precisão de acordo com os critérios que nos interessam.

As listas de palavras-chave para cada critério nos ajudam a equilibrar sensibilidade e precisão. Às vezes, podemos manter sentenças que não são diretamente relevantes porque entender quando informação está faltando é tão crítico quanto para o desempenho do modelo.

O Processo de Anotação

Depois de extrair as sentenças, tivemos dois anotadores revisando-as para rotular sua relevância em relação aos critérios. Resolvemos quaisquer desacordos através de discussão e consultando a documentação do ensaio. Esse processo de revisão garantiu que mantivéssemos os mesmos padrões das anotações originais dos ensaios.

Implementação do Modelo

Usamos vários modelos avançados de PLN para avaliar a eficácia da nossa abordagem. Dividimos o conjunto de dados em um conjunto de treinamento e um conjunto de teste, permitindo-nos avaliar o desempenho do modelo. O objetivo era usar os dados de treinamento para criar um modelo robusto que pudesse classificar com precisão os critérios de elegibilidade em diferentes ensaios.

Nossa avaliação incluiu vários modelos de PLN bem conhecidos, especialmente projetados para texto médico, como BioBERT e ClinicalBERT. Além disso, usamos nosso próprio modelo que foi especificamente treinado para este projeto.

Métricas de Avaliação

Para medir o quão bem nossos modelos se saíram, analisamos precisão, recall e pontuações F1. Essas métricas ajudam a mostrar quão precisamente o modelo pode identificar informações relevantes. Calculamos as pontuações tanto a nível de sentença quanto a nível de ensaio para entender como o modelo funciona em cenários do mundo real.

Resultados

Descobrimos que nosso modelo pré-treinado teve um desempenho muito bom, muitas vezes alcançando os melhores resultados em comparação com outros modelos para a maioria dos critérios. Por exemplo, ao testar o status de câncer anterior, nosso modelo teve uma pontuação alta. No entanto, alguns critérios foram mais desafiadores, como o status do HCV, onde o modelo teve dificuldade em identificar corretamente sentenças relevantes.

Apesar desses desafios, nossos resultados mostraram que nosso modelo poderia identificar e categorizar informações relevantes de forma eficaz, especialmente para critérios-chave de ensaios de câncer.

Conclusão

Em resumo, desenvolvemos com sucesso classificadores automáticos usando modelos de PLN para identificar critérios críticos de elegibilidade para ensaios clínicos de câncer. Nosso trabalho mostrou que essas ferramentas podem agregar valor ao melhorar o processo de recrutamento para pacientes e clínicos. Conforme avançamos, planejamos expandir nossos modelos para cobrir mais critérios e doenças, visando criar uma ferramenta abrangente que possa ajudar no recrutamento em ensaios clínicos em várias condições.

Ao simplificar a comunicação dos critérios de elegibilidade, podemos ajudar mais pacientes a encontrar os ensaios que podem oferecer esperança e novas opções de tratamento.

Artigos semelhantes