Técnicas Inovadoras para Melhorar Gráficos de Conhecimento
Novos métodos melhoram as incorporações de grafos de conhecimento usando informações literais.
― 9 min ler
Índice
- Contexto
- Nossa Abordagem
- Trabalhos Relacionados
- Operadores de Pré-processamento
- Tratando Literais Numéricos
- Tratando Literais Temporais
- Tratando Literais Textuais
- Tratando Literais de Imagem
- Mudanças de Tamanho nos Grafos de Conhecimento
- Experimentos e Resultados
- Conclusão e Trabalho Futuro
- Fonte original
- Ligações de referência
Grafos de Conhecimento são ferramentas usadas pra compartilhar informações em diferentes áreas. Eles são formados por Entidades, que podem ser qualquer coisa, tipo pessoas ou lugares, e as relações entre elas. Muitos grafos de conhecimento também incluem informações literais, como descrições, números ou imagens relacionadas a essas entidades. Por exemplo, um grafo de conhecimento pode ter uma descrição da cidade Mannheim, junto com sua população e uma imagem de um ponto turístico famoso.
A maioria dos métodos pra criar representações numéricas dessas entidades foca só nas relações entre elas. Eles pegam dados dessas relações, mas muitas vezes ignoram informações valiosas que estão nas descrições literais ou imagens. Incluir essas informações adicionais pode ajudar a criar representações mais precisas das entidades.
Embora existam alguns métodos que consideram informações literais, eles costumam ter limitações. Geralmente, eles focam em apenas um tipo de literal, como texto ou números, e não conseguem trabalhar bem com vários métodos de incorporação.
Este artigo apresenta um conjunto de operadores universais pra preparar grafos de conhecimento que contêm informações literais, tornando-os adequados pra vários tipos de dados. Esses operadores conseguem lidar com texto, números, datas e imagens, transformando o grafo de conhecimento original em um que pode trabalhar com qualquer método de incorporação. Testes mostraram que essas novas preparações podem melhorar os resultados das incorporações de grafos de conhecimento.
Contexto
Grafos de conhecimento são bem populares pra representar informações de áreas diversas. Eles contêm uma mistura de entidades e suas relações, junto com informações literais como descrições em texto e dados numéricos. Por exemplo, um grafo de conhecimento poderia representar a cidade Mannheim pelo seu nome, população e uma imagem de um local histórico.
Muitos métodos existentes de incorporação de grafos de conhecimento focam apenas nas relações entre as entidades. No exemplo de Mannheim, a maioria dos métodos usaria só seu nome e a população, ignorando qualquer outra informação útil que pode estar nas descrições literais ou imagens. Essa falta pode fazer com que detalhes importantes passem despercebidos, prejudicando a qualidade das representações.
Enquanto algumas abordagens novas começaram a considerar informações literais, elas normalmente focam em apenas um tipo e podem não ser adaptáveis a diferentes métodos de incorporação.
Nossa Abordagem
Este artigo apresenta um conjunto de operadores de Pré-processamento que podem transformar efetivamente grafos de conhecimento que contêm vários tipos de informações literais em grafos que só incluem relações. Assim, os grafos modificados podem ser usados com qualquer método de incorporação. Nós examinamos diferentes técnicas de pré-processamento para literais de texto, numéricos e de imagem que podem trabalhar junto com qualquer modelo de incorporação.
Trabalhos Relacionados
Muitos benchmarks comuns para incorporações de grafos de conhecimento não incluem informações literais. Portanto, esse tópico tem recebido menos atenção em comparação aos métodos que focam só em grafos de conhecimento relacionais.
Uma pesquisa de 2021 discute várias abordagens que principalmente se baseiam em modelos estabelecidos de incorporação de grafos de conhecimento. A maioria desses modelos são adaptações de modelos clássicos como o TransE. Embora essas adaptações ajustem a função de perda do modelo subjacente, elas continuam ligadas aos seus modelos específicos. Uma exceção é um método chamado LiteralE, que foi aplicado em vários modelos de incorporação. Porém, a maioria desses métodos ainda foca em apenas um tipo de literal.
Uma pesquisa mais recente confirma essas descobertas. Em contraste, o trabalho apresentado neste artigo propõe um método para pré-processar grafos de conhecimento que incluem dados literais. Essa abordagem visa criar um grafo que só contenha relações enquanto ainda representa as informações encontradas nos literais.
Algumas implementações, como o pyRDF2vec, conseguem extrair literais diretamente como características. Isso resulta em uma combinação de uma incorporação e dados literais adicionais, mas falta uma representação uniforme. Em vez disso, nosso objetivo é modificar o grafo primeiro, transformando os dados literais em declarações relacionais.
Embora métodos de pré-processamento ainda sejam incomuns, alguns pesquisadores têm usado estratégias como agrupar valores numéricos. Nós incorporamos algumas dessas ideias em nosso trabalho, junto com estratégias adicionais para pré-processamento de literais.
Operadores de Pré-processamento
Nosso foco é aumentar o grafo de conhecimento em vez de mudar o método de incorporação em si. Essa abordagem envolve adicionar nós e arestas extras que representam parte das informações contidas nos literais. No nosso framework, as etapas de incorporação e aumento são separadas das fases de classificação e avaliação.
Para nossos experimentos, consideramos problemas relacionados à classificação de nós, mas outras tarefas, como previsão de links ou agrupamento, também poderiam se beneficiar de nossas estratégias de pré-processamento.
Tratando Literais Numéricos
Criar uma entidade única pra cada literal numérico pode trazer desafios na hora de entender o significado desses valores. Por exemplo, fica difícil diferenciar entre dois valores numéricos bem parecidos e dois valores que são bem diferentes. Pra contornar isso, usamos várias técnicas de apresentação de literais numéricos, incluindo um método conhecido como agrupar.
A base da nossa estratégia de agrupamento é agrupar valores numéricos em categorias baseadas no seu intervalo. Outro método permite que os usuários especifiquem uma porcentagem de valores únicos ao criar os grupos. O agrupamento ajuda a resumir as informações e melhorar a compreensão geral dos dados.
Além disso, nós detectamos e removemos outliers antes de aplicar a estratégia de agrupamento. Se um valor for significativamente diferente dos demais, isso pode impactar negativamente a categorização dos outros valores.
Nós também consideramos diferentes tipos de objetos que podem compartilhar a mesma propriedade. Por exemplo, uma propriedade como altura pode se aplicar tanto a pessoas quanto a edifícios, que têm diferentes intervalos de altura. Portanto, consideramos os diferentes conjuntos de relações ligadas a cada tipo de objeto ao criar nossos grupos.
Tratando Literais Temporais
Pra lidar com datas, adotamos uma tática diferente. Nós convertemos a data em um timestamp e depois aplicamos a abordagem de agrupamento. Porém, esse método não capta totalmente todas as nuances de uma data. Por exemplo, duas pessoas podem compartilhar o mesmo aniversário, mas serem de anos diferentes. Pra resolver isso, extraímos características adicionais da data, permitindo que a gente construa uma representação mais detalhada.
As novas entidades criadas a partir dessas características podem se interconectar, ajudando a mostrar relações entre diferentes aspectos da data, como dias, meses e trimestres.
Tratando Literais Textuais
Informações textuais costumam aparecer em grafos de conhecimento, mas é desafiador representá-las de forma efetiva. Pra resolver isso, usamos modelagem de tópicos, que identifica os principais tópicos dentro de literais de texto. Cada tópico é então representado como um nó no grafo, permitindo uma melhor compreensão do conteúdo.
Pra esse processo, analisamos todos os valores de um literal de texto através de um algoritmo de modelagem de tópicos. Conectamos cada entidade aos tópicos que superam um determinado limite, ajudando a ilustrar a relação entre o texto e os tópicos identificados.
Tratando Literais de Imagem
Imagens em grafos de conhecimento também podem ser difíceis de representar bem. Utilizamos uma rede neural pré-treinada que consegue classificar imagens com base em seu conteúdo. Ao prever tags pra cada imagem, transformamos a informação em nós compreensíveis que descrevem o que as imagens estão mostrando.
Nos nossos experimentos, usamos um modelo de classificação de imagem reconhecido pra categorizar as imagens. Cada imagem pode ser representada pela classe mais provável, oferecendo uma descrição mais clara no grafo de conhecimento.
Mudanças de Tamanho nos Grafos de Conhecimento
Quando aplicamos essas técnicas de pré-processamento, o tamanho do grafo de conhecimento resultante pode mudar. Nós examinamos o número de entidades e declarações após transformar os dados. As descobertas mostram que, embora o número de declarações permaneça semelhante ao grafo de conhecimento original, o número de entidades pode variar.
Experimentos e Resultados
Para nossos experimentos, testamos todas as abordagens de pré-processamento em um conjunto de dados de benchmark, que contém vários conjuntos de dados. Usamos diferentes métodos de incorporação e classificadores pra avaliar os resultados.
Treinamos os métodos de incorporação com base em parâmetros definidos, o que nos permitiu observar quão efetivamente nossas estratégias de pré-processamento melhoraram os resultados. Os experimentos tinham o objetivo de identificar quais estratégias proporcionaram o melhor desempenho geral.
Nossos resultados indicam que diferentes estratégias se saíram bem pra cada tipo de literal. Em muitos casos, as técnicas de pré-processamento permitiram que melhorássemos os resultados em comparação com as referências.
Curiosamente, não houve uma conexão evidente entre o número de literais de um tipo específico e as melhorias alcançadas ao incluir essa informação. Isso sugere que a eficácia dos dados literais depende mais da qualidade em vez da quantidade.
Nós também notamos que algumas abordagens de referência eram fortes concorrentes, indicando que a simples presença de um literal pode ser um sinal útil, mesmo sem considerar seu valor específico.
Conclusão e Trabalho Futuro
Resumindo, mostramos que usar técnicas de pré-processamento pra representar informações literais em grafos de conhecimento pode melhorar significativamente os resultados de incorporação. Nossa abordagem permite flexibilidade, já que o conjunto de operadores de pré-processamento pode ser expandido ou refinado no futuro.
Daqui pra frente, podemos continuar aprimorando nossos métodos de representação textual e de imagem integrando modelos avançados. Diferentes estágios também podem ser empregados pra processar texto ou imagens de forma eficaz, melhorando a qualidade geral.
Além disso, nossos métodos não só criam novas entidades, como também fornecem pontuações pras representações. Isso significa que podemos considerar essas pontuações como pesos ao incorporar os dados. No geral, nossas descobertas apontam pra oportunidades empolgantes para mais desenvolvimento e pesquisa nessa área.
Título: Universal Preprocessing Operators for Embedding Knowledge Graphs with Literals
Resumo: Knowledge graph embeddings are dense numerical representations of entities in a knowledge graph (KG). While the majority of approaches concentrate only on relational information, i.e., relations between entities, fewer approaches exist which also take information about literal values (e.g., textual descriptions or numerical information) into account. Those which exist are typically tailored towards a particular modality of literal and a particular embedding method. In this paper, we propose a set of universal preprocessing operators which can be used to transform KGs with literals for numerical, temporal, textual, and image information, so that the transformed KGs can be embedded with any method. The results on the kgbench dataset with three different embedding methods show promising results.
Autores: Patryk Preisner, Heiko Paulheim
Última atualização: 2023-09-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2309.03023
Fonte PDF: https://arxiv.org/pdf/2309.03023
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://pygments.org/
- https://pypi.python.org/pypi/Pygments
- https://yamadharma.github.io/
- https://kmitd.github.io/ilaria/
- https://conceptbase.sourceforge.net/mjf/
- https://name.example.com
- https://ctan.org/pkg/booktabs
- https://goo.gl/VLCRBB
- https://github.com/borisveytsman/acmart
- https://www.ctan.org/tex-archive/macros/latex/contrib/els-cas-templates
- https://github.com/yamadharma/ceurart
- https://www.overleaf.com/project/5e76702c4acae70001d3bc87
- https://www.overleaf.com/latex/templates/template-for-submissions-to-ceur-workshop-proceedings-ceur-ws-dot-org/pkfscdkgkhcq
- https://www.heikopaulheim.com/
- https://commons.wikimedia.org/wiki/Special:FilePath/
- https://gitlab.com/patryk.preisner/mkga/