Simple Science

Ciência de ponta explicada de forma simples

# Informática# Aprendizagem de máquinas

Melhorando as Previsões de Interação do Usuário em Redes

Um novo modelo pra previsões melhores de interação em redes de usuário-item.

― 7 min ler


Modelo de Previsão deModelo de Previsão deInteração de PróximaGeraçãointerações usuário-item com precisão.Uma nova abordagem pra prever
Índice

Redes de interação são sistemas onde usuários e itens se conectam através de várias ações, como compras ou cliques. Essas redes são essenciais em aplicações como recomendar produtos para usuários, encontrar buscas relacionadas ou sugerir posts nas redes sociais. Entender como prever interações futuras nessas redes pode melhorar muito a experiência e engajamento dos usuários.

A Importância de Prever Interações Futuras

Em muitas plataformas online, prever como um usuário vai interagir com itens pode melhorar a experiência do usuário. Por exemplo, em e-commerce, saber quais produtos um usuário provavelmente vai comprar pode levar a melhores recomendações, aumentando as vendas e a satisfação do cliente. Nas redes sociais, entender quais posts um usuário pode interagir pode melhorar a visibilidade e relevância do conteúdo, aumentando o engajamento.

Métodos Atuais e Limitações

A maioria dos métodos existentes para prever interações foca em tratar usuários e itens como se estivessem no mesmo espaço, frequentemente usando uma geometria simples chamada espaço euclidiano. Embora essa abordagem tenha mostrado algum sucesso, ela ignora diferenças importantes entre usuários e itens. Na real, usuários e itens têm características únicas que podem exigir maneiras diferentes de representação.

Temos três principais problemas com os métodos atuais:

  1. Natureza Bipartida: Usuários e itens são colocados no mesmo espaço, apesar de serem diferentes.
  2. Dinâmica da Rede: A maioria das abordagens assume que a representação da rede permanece estática, sem considerar como novas interações podem mudar a estrutura da rede ao longo do tempo.
  3. Paradigma de Aprendizado: Muitos modelos exigem rótulos para treinamento, o que pode ser caro e, às vezes, não confiável.

Uma Nova Abordagem

Para lidar com esses problemas, apresentamos um novo modelo que usa dois espaços separados para usuários e itens. Esse modelo reconhece que usuários e itens têm características diferentes e não devem ser tratados da mesma forma.

Representações Co-Evolutivas

Na nossa abordagem, oferecemos uma solução nova usando dois espaços diferentes que evoluem ao longo do tempo. Isso significa que, à medida que as interações acontecem, a forma como representamos usuários e itens pode mudar. Também introduzimos um método para estimar como esses espaços devem mudar ao longo do tempo, acomodando a dinâmica das interações usuário-item.

Componentes Chave do Modelo

Agregação Cross-Space

Uma das principais partes do nosso modelo é um processo chamado Agregação Cross-Space. Isso permite que mensagens passem entre o espaço do usuário e o espaço do item. Em termos simples, isso deixa a informação fluir para frente e para trás, assim cada um pode aprender com o outro.

Estimador de Curvatura Neural

A próxima parte chave é uma ferramenta que desenvolvemos chamada Estimador de Curvatura Neural. Essa ferramenta nos ajuda a entender como os espaços evoluem ao longo do tempo com base nas interações que ocorrem. Ela leva em conta tanto os espaços de usuários quanto de itens, garantindo que eles cresçam juntos conforme novas interações acontecem.

Aprendizado Auto-Supervisionado

Nossa abordagem não requer dados rotulados. Em vez disso, usamos um método de aprendizado auto-supervisionado, o que significa que o modelo aprende com os dados em si, distinguindo entre o que é similar e o que é diferente. Isso é especialmente útil porque adquirir rótulos pode ser caro e, às vezes, não confiável.

O Método de Aprendizado Co-Contrastivo

Um aspecto significativo do nosso modelo é o método de aprendizado co-contrastivo. Aqui está como funciona:

  1. Interação Usuário-Item: Em vez de comparar usuários apenas entre si ou itens apenas entre si, permitimos que usuários sejam comparados com itens e vice-versa. Isso captura a interação entre usuários e itens de forma mais eficaz.

  2. Foco em Amostras Difíceis: Nós damos atenção especial a exemplos desafiadores durante o processo de aprendizado. Isso foca o aprendizado nas interações mais informativas, melhorando o desempenho do modelo.

Resultados Experimentais

Para validar nosso modelo, realizamos vários experimentos usando múltiplos conjuntos de dados. Medimos quão bem nosso modelo identifica interações futuras comparado a métodos existentes de ponta.

Avaliação de Desempenho

Usamos duas métricas de desempenho para avaliar nosso modelo:

  • Classificação Recíproca Média (MRR): Isso mede quão bem o modelo classifica os itens corretos ao prever com o que um usuário pode interagir a seguir.

  • Taxa de Acerto: Isso nos diz com que frequência o modelo prevê corretamente os principais itens com os quais um usuário vai se engajar.

Nossos resultados mostraram que nosso modelo superou consistentemente os métodos existentes em diferentes conjuntos de dados. Isso indica que separar usuários e itens em espaços diferentes e levar em conta sua natureza evolutiva leva a previsões mais precisas.

Comparando com Modelos Existentes

Para avaliar ainda mais a eficácia do nosso modelo, comparamos ele com vários modelos existentes usados para tarefas similares:

  • Modelos Recorrentes: Esses modelos são projetados para dados sequenciais e lidam com o aspecto temporal das interações.

  • Modelos de Caminhada Aleatória: Esses modelos usam caminhadas aleatórias para entender como as interações se conectam ao longo do tempo.

  • Modelos de Interação: Esses modelos focam especificamente nas interações entre usuários e itens.

Durante nossos experimentos, notamos que, enquanto alguns modelos existentes se saíram bem, eles geralmente estavam atrás do nosso modelo proposto, especialmente na maneira como lidam com a natureza evolutiva das redes de interação.

A Importância da Geometria Riemanniana

Um conceito central na nossa abordagem é a geometria riemanniana, que oferece uma forma mais flexível de representar estruturas complexas. A geometria euclidiana tradicional pode não capturar adequadamente as características das interações usuário-item, especialmente aquelas que exibem relações hierárquicas ou cíclicas.

Espaços Hiperbólicos e Esféricos

Usar geometria riemanniana nos permite explorar diferentes tipos de espaços, como espaços hiperbólicos e esféricos. Esses espaços são mais adequados para capturar as estruturas ricas presentes nas redes de interação. Usar essas geometrias ajuda nosso modelo a refletir melhor as relações e distâncias entre usuários e itens.

Entendendo a Curvatura

Na geometria riemanniana, a curvatura é um conceito fundamental que descreve como um espaço se dobra ou torce. Ao estimar a curvatura dos nossos espaços de usuários e itens, podemos entender melhor como a estrutura da nossa rede de interação evolui ao longo do tempo. Essa compreensão permite previsões mais precisas.

Conclusão

Em conclusão, nosso novo modelo para prever interações em redes sequenciais se baseia no conhecimento existente enquanto aborda suas limitações. Ao usar espaços separados e em evolução para usuários e itens e aplicar técnicas de aprendizado auto-supervisionado, oferecemos uma estrutura robusta que melhora a forma como prevemos interações. Nossos resultados experimentais confirmam a superioridade do modelo sobre métodos anteriores, abrindo caminho para sistemas de recomendação mais eficazes e estratégias de engajamento do usuário em várias aplicações.

Fonte original

Título: Contrastive Sequential Interaction Network Learning on Co-Evolving Riemannian Spaces

Resumo: The sequential interaction network usually find itself in a variety of applications, e.g., recommender system. Herein, inferring future interaction is of fundamental importance, and previous efforts are mainly focused on the dynamics in the classic zero-curvature Euclidean space. Despite the promising results achieved by previous methods, a range of significant issues still largely remains open: On the bipartite nature, is it appropriate to place user and item nodes in one identical space regardless of their inherent difference? On the network dynamics, instead of a fixed curvature space, will the representation spaces evolve when new interactions arrive continuously? On the learning paradigm, can we get rid of the label information costly to acquire? To address the aforementioned issues, we propose a novel Contrastive model for Sequential Interaction Network learning on Co-Evolving RiEmannian spaces, CSINCERE. To the best of our knowledge, we are the first to introduce a couple of co-evolving representation spaces, rather than a single or static space, and propose a co-contrastive learning for the sequential interaction network. In CSINCERE, we formulate a Cross-Space Aggregation for message-passing across representation spaces of different Riemannian geometries, and design a Neural Curvature Estimator based on Ricci curvatures for modeling the space evolvement over time. Thereafter, we present a Reweighed Co-Contrast between the temporal views of the sequential network, so that the couple of Riemannian spaces interact with each other for the interaction prediction without labels. Empirical results on 5 public datasets show the superiority of CSINCERE over the state-of-the-art methods.

Autores: Li Sun, Junda Ye, Jiawei Zhang, Yong Yang, Mingsheng Liu, Feiyang Wang, Philip S. Yu

Última atualização: 2024-01-02 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2401.01243

Fonte PDF: https://arxiv.org/pdf/2401.01243

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes