Simple Science

Ciência de ponta explicada de forma simples

# Informática# Recuperação de informação# Aprendizagem de máquinas

Aprimorando GNNs em Sistemas de Recomendação

A estrutura ITEM melhora o treinamento e a avaliação de GNNs para recomendações melhores.

― 7 min ler


GNNs Melhorados paraGNNs Melhorados paraRecomendaçõesmundo real.de GNN em tarefas de recomendação doA estrutura ITEM melhora a performance
Índice

Sistemas de recomendação são ferramentas que ajudam os usuários a encontrar conteúdo relevante online. Eles são super usados em várias aplicações, como serviços de streaming, compras online e redes sociais. Um método popular pra construir esses sistemas é o chamado Filtragem Colaborativa. Essa abordagem usa o comportamento dos usuários e as relações entre itens pra recomendar coisas que um usuário pode gostar com base no histórico de interações dele.

Redes Neurais Gráficas (GNNs) têm conquistado popularidade em tarefas de recomendação porque conseguem capturar relações complexas dentro dos dados de uma forma eficiente. As GNNs, especialmente as que usam técnicas de passagem de mensagem, são boas em entender as conexões entre usuários e itens. Mas, muitos GNNs ainda dependem de métodos de treinamento tradicionais que podem não se alinhar completamente com a forma como medimos seu desempenho.

Neste artigo, vamos focar em melhorar o treinamento e a avaliação das GNNs em tarefas de recomendação. Apresentamos uma nova estrutura chamada ITEM, que significa Melhorando o Treinamento e a Avaliação de GNNs Baseadas em Passagem de Mensagem. Vamos discutir como o ITEM melhora o processo de treinamento e fornece uma avaliação melhor das GNNs em comparação com métodos existentes.

A Importância dos Sistemas de Recomendação

No mundo digital de hoje, as pessoas têm acesso a uma quantidade absurda de informações. Encontrar o que é relevante pode ser desafiador. Os sistemas de recomendação têm um papel crucial em ajudar os usuários a navegar por esse oceano vasto de conteúdo. Ao analisar o comportamento e as preferências dos usuários, esses sistemas podem sugerir itens que combinam com os gostos individuais, melhorando a experiência e o engajamento do usuário.

Filtragem colaborativa é uma das abordagens mais comuns pra construir sistemas de recomendação. Ela usa as interações passadas dos usuários pra prever o que eles podem gostar no futuro. Esse método geralmente funciona bem, mas pode ser limitado na sua capacidade de descobrir conexões mais profundas entre usuários e itens.

Desafios no Treinamento de GNNs

Apesar das vantagens, as GNNs enfrentam desafios específicos no treinamento pra tarefas de recomendação. Muitos modelos de GNN usam uma abordagem indireta pra otimizar seu desempenho, geralmente confiando em funções de perda tradicionais que não visam diretamente as métricas de avaliação relevantes. Essa falta de alinhamento entre treinamento e avaliação pode levar a resultados subótimos.

A maioria das GNNs é comumente treinada usando funções de perda pareadas como o Ranking Personalizado Bayesiano (BPR). Embora o BPR seja eficaz pra otimizar interações entre usuários e itens, nem sempre se alinha perfeitamente com as métricas baseadas em ranking que usamos pra avaliar recomendações. Essas métricas de avaliação, como NDCG (Ganho Cumulativo Descontado Normalizado) e Recall, são muitas vezes não diferenciáveis, dificultando a otimização direta durante o treinamento.

Outro desafio significativo vem da forma como as GNNs são avaliadas. Muitos protocolos de avaliação atuais não representam adequadamente as condições do mundo real. Por exemplo, muitos modelos são testados nos mesmos usuários com os quais foram treinados, limitando sua capacidade de generalizar pra novos usuários. Essa abordagem não reflete situações reais de uso, onde novos usuários interagem com o sistema sem dados prévios.

Apresentando a Estrutura ITEM

Pra resolver esses desafios, desenvolvemos a estrutura ITEM. Essa nova abordagem foca em duas áreas principais: otimizar os processos de treinamento com funções de perda apropriadas e melhorar os métodos de avaliação pra refletir cenários do mundo real.

Otimizando o Treinamento com Perdas de Ranking

A estrutura ITEM incorpora Funções de Perda de Ranking que se alinham de perto com as métricas de avaliação. Em vez de depender apenas do BPR, o ITEM usa uma função de perda que otimiza diretamente as métricas reais usadas pra medir o desempenho.

Adotando essa abordagem, as GNNs são treinadas pra focar nos resultados que são mais importantes-especificamente nas preferências reais de ranking dos usuários. Essa mudança garante que, enquanto as GNNs aprendem com os dados, elas o fazem com uma compreensão clara de como seus resultados serão avaliados.

Estratégia de Amostragem Personalizada

Outra inovação significativa dentro do ITEM é sua estratégia de Amostragem Negativa. Métodos tradicionais frequentemente usam amostras negativas aleatórias, que podem não fornecer distinções significativas entre itens positivos e negativos. Em contraste, o ITEM incorpora uma técnica de amostragem baseada em PageRank Personalizado (PPR). Esse método seleciona itens negativos com base na proximidade deles em relação aos usuários dentro da estrutura do gráfico, garantindo que as amostras sejam mais relevantes e informativas.

Usando amostragem baseada em PPR, o ITEM garante que a GNN seja desafiada com exemplos negativos mais difíceis durante o treinamento. Essa abordagem melhora o processo de aprendizado e a capacidade do modelo de fazer recomendações precisas.

Protocolo de Avaliação Indutiva de Divisão de Usuários

O ITEM também introduz um protocolo de avaliação mais realista chamado protocolo de divisão de usuários indutivos. Nesse cenário, o modelo é testado em usuários que não foram vistos durante o treinamento, o que é mais representativo de situações reais onde novos usuários interagem com o sistema pela primeira vez. Ao examinar como as recomendações são feitas pra esses usuários não vistos, o ITEM fornece uma compreensão melhor do desempenho de uma GNN em aplicações do mundo real.

Validação Experimental

Pra demonstrar a eficácia do ITEM, realizamos experimentos extensivos usando vários conjuntos de dados. Comparamos o desempenho do ITEM com abordagens padrão, incluindo a função de perda BPR tradicional e outros modelos de GNN de ponta.

Conjuntos de Dados

Validamos o ITEM em vários conjuntos de dados de recomendação amplamente utilizados, incluindo MovieLens e Yelp. Esses conjuntos de dados apresentam interações usuário-item que permitem uma avaliação abrangente do desempenho dos modelos.

Resultados

Nossos experimentos mostraram que o ITEM superou significativamente o BPR tradicional e outros modelos de GNN em vários conjuntos de dados. As melhorias foram evidentes tanto em configurações transdutivas quanto indutivas, destacando a capacidade do ITEM de fornecer melhores processos de treinamento e resultados de avaliação.

Especificamente, os ganhos de desempenho do ITEM foram notáveis em termos de recomendações positivas. A qualidade do ranking melhorou, demonstrando que as mudanças feitas nas características de treinamento resultaram em recomendações gerais melhores.

Conclusão

A estrutura ITEM representa um avanço significativo no treinamento e na avaliação de GNNs para tarefas de recomendação. Ao focar em funções de perda de ranking e protocolos de avaliação realistas, o ITEM supera muitas das limitações encontradas em métodos tradicionais.

À medida que os sistemas de recomendação continuam a crescer em importância, estruturas como o ITEM serão cruciais pra aprimorar a forma como esses sistemas operam. Com estratégias de treinamento e avaliação melhoradas, o ITEM aumenta a capacidade das GNNs de fornecer recomendações significativas, beneficiando usuários na busca por conteúdo relevante.

Em resumo, o ITEM ajuda a fechar a lacuna entre os objetivos de treinamento e as métricas de avaliação, estabelecendo uma abordagem mais robusta e eficaz para sistemas de recomendação. A integração de estratégias de amostragem personalizadas e protocolos de avaliação realistas garante que as GNNs possam se destacar em aplicações do mundo real, abrindo caminho pra melhores experiências de usuário em várias plataformas.

Fonte original

Título: ITEM: Improving Training and Evaluation of Message-Passing based GNNs for top-k recommendation

Resumo: Graph Neural Networks (GNNs), especially message-passing-based models, have become prominent in top-k recommendation tasks, outperforming matrix factorization models due to their ability to efficiently aggregate information from a broader context. Although GNNs are evaluated with ranking-based metrics, e.g NDCG@k and Recall@k, they remain largely trained with proxy losses, e.g the BPR loss. In this work we explore the use of ranking loss functions to directly optimize the evaluation metrics, an area not extensively investigated in the GNN community for collaborative filtering. We take advantage of smooth approximations of the rank to facilitate end-to-end training of GNNs and propose a Personalized PageRank-based negative sampling strategy tailored for ranking loss functions. Moreover, we extend the evaluation of GNN models for top-k recommendation tasks with an inductive user-centric protocol, providing a more accurate reflection of real-world applications. Our proposed method significantly outperforms the standard BPR loss and more advanced losses across four datasets and four recent GNN architectures while also exhibiting faster training. Demonstrating the potential of ranking loss functions in improving GNN training for collaborative filtering tasks.

Autores: Yannis Karmim, Elias Ramzi, Raphaël Fournier-S'niehotta, Nicolas Thome

Última atualização: 2024-07-03 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2407.07912

Fonte PDF: https://arxiv.org/pdf/2407.07912

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes