Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Informatica sanitaria

Melhorando a Detecção de Eventos Adversos a Medicamentos Através do Conhecimento Contextual

Este estudo analisa como o conhecimento contextual melhora a detecção de eventos adversos relacionados a medicamentos.

― 8 min ler


Aprimorando Métodos deAprimorando Métodos deDetecção de ADEmedicamentos.ajuda a identificar eventos adversos deEstudo mostra que saber o contexto
Índice

Eventos Adversos a Medicamentos (EAMs) são lesões que podem rolar por conta do uso de remédios. Eles são uma preocupação grande na medicina, já que estão diretamente relacionados à segurança dos pacientes. Muita gente compartilha suas experiências negativas com medicamentos por vários meios, como sistemas de denúncia oficiais e redes sociais. Os médicos também anotam esses eventos em suas anotações clínicas. Mas, muitas vezes, essas ocorrências acabam perdidas em textos longos, dificultando a identificação e extração das informações relevantes. Por isso, achar uma maneira de filtrar automaticamente essa quantidade enorme de texto pode economizar tempo para os profissionais de saúde. É preciso métodos eficazes para encontrar e extrair dados sobre EAMs de várias fontes de texto.

Avanços em Tecnologia

Nos últimos anos, o campo do Processamento de Linguagem Natural (PLN) evoluiu bastante, especialmente com novos modelos de linguagem que usam uma estrutura chamada transformers. Esses modelos se saem bem em várias tarefas que envolvem texto. Alguns têm sido aplicados com sucesso para detectar EAMs em documentos escritos. Os textos relacionados aos EAMs geralmente caem em duas categorias: relatórios formais feitos por profissionais de saúde e relatos informais compartilhados por pacientes ou suas famílias, muitas vezes nas redes sociais. Os textos informais podem ter gírias, abreviações e opiniões, tornando-se diferentes dos relatórios médicos. Com o aumento desse tipo de texto informal, é necessário analisar especificamente as informações relatadas pelos pacientes.

Tipos de Dados Usados

Neste estudo, analisamos vários Conjuntos de dados que contêm informações relevantes sobre EAMs. Um conjunto chave é o corpus CADEC, que consiste em postagens anotadas de um site onde pacientes compartilham suas experiências com medicamentos. Outro conjunto, chamado SMM4H, inclui postagens no Twitter que mencionam EAMs. Além disso, existem outras fontes de dados, incluindo PSYTAR, TAC e conjuntos de dados de EAM. Cada uma dessas fontes tem características únicas. Os conjuntos CADEC, SMM4H e PSYTAR consistem principalmente em textos escritos por pacientes, enquanto TAC e ADE contêm linguagem formal e científica, feita por especialistas médicos.

Pesquisa Anterior em Extração de EAMs

Vários estudos anteriores tentaram encontrar maneiras de extrair informações sobre EAMs de textos. Alguns desses estudos testaram diferentes modelos de linguagem no corpus CADEC, obtendo taxas de sucesso variadas. Por exemplo, um modelo conseguiu uma pontuação significativa com base em correspondências rigorosas, enquanto outros usaram abordagens diferentes para relatar suas descobertas. Diferentes técnicas, como aprendizado federado e aprendizado multitarefa, também foram usadas para enfrentar o problema da extração de EAMs.

Nossa Abordagem de Pesquisa

Nesta pesquisa, realizamos experimentos para avaliar diferentes métodos para melhorar a detecção de EAMs usando os conjuntos de dados mencionados. Focamos em combinar modelos modernos baseados em transformers com conhecimento contextual adicional para melhores resultados. Isso envolveu a criação de um grafo de conhecimento que captura informações sobre nomes de medicamentos e sintomas. Usamos um tipo de rede chamada rede neural gráfica para aprender representações dos dados de medicamentos e sintomas.

Conjuntos de Dados e Recursos de Conhecimento

Utilizamos vários conjuntos de dados, incluindo CADEC, SMM4H, PSYTAR, TAC e ADE, para realizar nossos experimentos. O corpus CADEC contém postagens de pacientes discutindo suas experiências com vários medicamentos. O conjunto SMM4H foca em postagens do Twitter e inclui apenas menções de reações adversas a medicamentos, sem anotações detalhadas de medicamentos. O corpus PSYTAR contém análises de medicamentos psiquiátricos específicos, enquanto o corpus TAC é baseado em rótulos de medicamentos. O corpus ADE é composto por relatórios de casos da literatura médica.

O Conjunto de Dados CADEC

O conjunto de dados CADEC inclui vários tipos de anotações, como EAMs, medicamentos, doenças, sintomas e outras descobertas clínicas. Ele apresenta postagens relacionadas a vários medicamentos, incluindo Diclofenaco e Lipitor, e contém mais de mil anotações referentes a menções de EAMs.

O Conjunto de Dados SMM4H

O conjunto SMM4H faz parte de uma iniciativa de mineração de redes sociais. Especificamente, focamos em um subconjunto de tweets que mencionam EAMs, com cerca de 1.300 tweets e 1.800 menções anotadas.

O Conjunto de Dados PSYTAR

O corpus PSYTAR é composto por análises de pacientes sobre medicamentos psiquiátricos. Contém várias anotações, incluindo menções de EAMs e sintomas, tornando-se um recurso valioso para entender reações adversas a esses tipos de medicamentos.

Os Conjuntos de Dados TAC e ADE

O corpus TAC foi criado a partir de rótulos de medicamentos e usado em um desafio de anotação de texto. O objetivo é extrair diferentes entidades, incluindo menções de EAMs. O conjunto de dados ADE compreende relatórios de casos, permitindo uma análise completa de eventos adversos em um contexto clínico.

Bases de Conhecimento e Ontologias

Para aprimorar nossos modelos de detecção de EAMs, utilizamos recursos de conhecimento que oferecem informações estruturadas sobre sintomas e medicamentos. Esses recursos ajudam a dar contexto ao modelo, permitindo que ele utilize dados mais ricos ao identificar EAMs.

Ontologia de Sintomas

A ontologia de sintomas é uma maneira organizada de categorizar sintomas com base em suas definições e relacionamentos. Ela ajuda a criar uma compreensão compartilhada de como os sintomas estão relacionados a doenças e medicamentos.

Recursos de Medicamentos

Para medicamentos, criamos uma ontologia que consolida conhecimentos de várias bases de dados de medicamentos. Esta ontologia inclui informações sobre nomes de medicamentos, descrições, mecanismos de ação e classificações.

Metodologia para Detecção de EAMs

Nossa abordagem para detectar EAMs envolve combinar o conhecimento de recursos de medicamentos e sintomas com modelos baseados em transformers. Primeiro, identificamos potenciais entidades de medicamentos e sintomas em um texto dado usando um sistema de tagueamento baseado em regras. Após a marcação, processamos os tokens identificados para extrair informações contextuais adicionais usando nossos Grafos de Conhecimento.

Modelos de Fusão de Conhecimento

Testamos diferentes métodos para incorporar conhecimento em nossos modelos, incluindo o uso de embeddings de grafos de conhecimento. Esse processo de embedding permite uma melhor integração das informações contextuais com o modelo de linguagem.

Arquitetura do Modelo

Nossa pesquisa usou várias arquiteturas de modelo, explorando combinações de vários modelos de transformers com a fusão de conhecimento. Apresentamos resultados de referência usando BERT e BioBERT, que são amplamente utilizados em várias tarefas de PLN.

Processo de Treinamento e Avaliação

Para uma avaliação justa de nossos modelos, dividimos nossos conjuntos de dados em conjuntos de treinamento, validação e teste. Cada modelo foi treinado usando uma configuração similar para garantir consistência nos resultados. Ajustamos cuidadosamente os hiperparâmetros para maximizar o desempenho.

Métricas de Avaliação

Para avaliar nossos modelos, examinamos métricas como precisão, recall e a pontuação F1. Cada conjunto de dados foi rotulado usando um método específico que categoriza o texto em diferentes classes, e a avaliação final se concentrou na comparação de menções completas de EAMs.

Visão Geral dos Resultados

Após realizar vários experimentos, comparamos o desempenho de vários modelos nos conjuntos de teste de cada conjunto de dados. Os resultados mostraram que modelos aprimorados com conhecimento contextual tendiam a ter um desempenho melhor, especialmente em textos mais curtos e informais.

Análise dos Resultados

Ao analisar nossas descobertas, percebemos que a eficácia dos modelos de fusão de conhecimento variou entre os diferentes conjuntos de dados. Por exemplo, no conjunto CADEC, o desempenho não melhorou significativamente com a adição de conhecimento, enquanto os modelos se saíram melhor nos conjuntos SMM4H e PSYTAR.

Insights Obtidos

A partir de nossos experimentos, descobrimos que o conhecimento contextual relacionado a medicamentos foi particularmente útil para melhorar o Desempenho do Modelo. O conjunto CADEC tinha características únicas, mostrando uma limitação para os métodos de fusão de conhecimento. Os outros conjuntos de dados se beneficiaram mais das informações adicionais fornecidas.

Direções Futuras

Há uma necessidade contínua de mais pesquisas na extração de EAMs a partir de textos, especialmente em relação ao conhecimento ausente ou à necessidade de melhores sistemas de rotulação. Explorar métodos avançados de aprendizado de máquina para reconhecimento de entidades pode trazer ainda mais melhorias. A construção de conjuntos de dados mais abrangentes contendo EAMs relatados por pacientes também ajudará a aprimorar modelos futuros.

Conclusão

Este trabalho oferece insights sobre como o conhecimento contextual pode enriquecer modelos para a extração de eventos adversos a medicamentos. Ao integrar várias fontes de dados e bases de conhecimento, demonstramos que saber mais sobre medicamentos e sintomas pode ajudar os modelos a ter um desempenho melhor, especialmente em textos informais. A arquitetura que desenvolvemos serve como um método promissor para aprimorar ainda mais a detecção de EAMs em documentos escritos.

Entender e abordar EAMs é crucial para melhorar a segurança dos medicamentos e garantir que os pacientes recebam um atendimento de qualidade. Com os avanços contínuos na tecnologia, temos o potencial de aproveitar melhor os dados de várias fontes, contribuindo, em última análise, para melhores resultados de saúde para os pacientes.

Fonte original

Título: Evaluating Knowledge Fusion Models on Detecting Adverse Drug Events in Text

Resumo: BackgroundDetecting adverse drug events (ADE) of drugs that are already available on the market is an essential part of the pharmacovigilance work conducted by both medical regulatory bodies and the pharmaceutical industry. Concerns regarding drug safety and economic interests serve as motivating factors for the efforts to identify ADEs. Hereby, social media platforms play an important role as a valuable source of reports on ADEs, particularly through collecting posts discussing adverse events associated with specific drugs. MethodologyWe aim with our study to assess the effectiveness of knowledge fusion approaches in combination with transformer-based NLP models to extract ADE mentions from diverse datasets, for instance, texts from Twitter, websites like askapatient.com, and drug labels. The extraction task is formulated as a named entity recognition (NER) problem. The proposed methodology involves applying fusion learning methods to enhance the performance of transformer-based language models with additional contextual knowledge from ontologies or knowledge graphs. Additionally, the study introduces a multi-modal architecture that combines transformer-based language models with graph attention networks (GAT) to identify ADE spans in textual data. ResultsA multi-modality model consisting of the ERNIE model with knowledge on drugs reached an F1-score of 71.84% on CADEC corpus. Additionally, a combination of a graph attention network with BERT resulted in an F1-score of 65.16% on SMM4H corpus. Impressively, the same model achieved an F1-score of 72.50% on the PSYTAR corpus, 79.54% on the ADE corpus, and 94.15% on the TAC corpus. Except for the CADEC corpus, the knowledge fusion models consistently outperformed the baseline model, BERT. ConclusionOur study demonstrates the significance of context knowledge in improving the performance of knowledge fusion models for detecting ADEs from various types of textual data. Author SummaryAdverse Drug Events (ADEs) are one of the main aspects of drug safety and play an important role during all phases of drug development, including post-marketing pharmacovigilance. Negative experiences with medications are frequently reported in textual form by individuals themselves through official reporting systems or social media posts, as well as by doctors in their medical notes. Automated extraction of ADEs allows us to identify these in large amounts of text as they are produced every day on various platforms. The text sources vary highly in structure and the type of language included which imposes certain challenges on extraction systems. This work investigates to which extent knowledge fusion models may overcome these challenges by fusing structured knowledge coming from ontologies with language models such as BERT. This is of great interest since the scientific community provides highly curated resources in the form of ontologies that can be utilized for tasks such as extracting ADEs from texts.

Autores: Sumit Madan, P. Wegner, H. Fröhlich

Última atualização: 2024-02-15 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.02.14.24302829

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.02.14.24302829.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes