Simple Science

Ciência de ponta explicada de forma simples

# Informática# Recuperação de informação

Abordando o Viés de Popularidade em Sistemas de Recomendação

Este artigo propõe um método para corrigir o viés de popularidade em recomendações baseadas em GCN.

― 7 min ler


Corrigindo o viés deCorrigindo o viés depopularidade nasrecomendaçõespara itens menos conhecidos.Um novo método melhora as recomendações
Índice

Sistemas de recomendação ajudam os usuários a encontrarem coisas que eles podem gostar, como filmes, livros ou produtos, com base nas suas preferências. Muitos desses sistemas usam técnicas que analisam as relações entre usuários e itens, especialmente redes neurais convolucionais de grafos (GCNs). Embora as GCNs possam melhorar as Recomendações em geral, elas tendem a favorecer itens populares, o que significa que itens menos populares ou "de cauda" são recomendados com menos frequência. Isso é conhecido como Viés de Popularidade.

O foco deste trabalho é investigar como as GCNs aumentam esse viés de popularidade nas recomendações e propor uma solução para esse problema. Explicamos os mecanismos por trás do viés, apresentamos nosso método proposto para corrigi-lo e demonstramos sua eficácia por meio de experimentos.

Contexto

Os sistemas de recomendação se tornaram cruciais na nossa era digital, oferecendo conteúdo personalizado aos usuários. Eles são amplamente utilizados em várias indústrias, incluindo e-commerce, serviços de streaming e redes sociais. Entre as várias técnicas disponíveis para construir sistemas de recomendação, as GCNs ganharam popularidade por sua capacidade de capturar relações complexas entre usuários e itens por meio de estruturas de grafos.

Apesar das suas vantagens, as GCNs têm uma desvantagem significativa: elas tendem a recomendar demais itens populares. À medida que os usuários interagem mais com esses itens, o sistema aprende a favorecê-los ainda mais, diminuindo as chances de itens menos populares serem recomendados. Isso cria um desequilíbrio que pode levar à insatisfação do usuário e oportunidades perdidas de descobrir conteúdos de nicho.

O Problema do Viés de Popularidade

O problema do viés de popularidade vem de como as GCNs funcionam. Em uma configuração típica, itens com muitas interações ganham mais influência sobre as recomendações. Quando uma GCN processa dados, ela foca em como itens "populares" podem dominar o espaço de recomendações.

Dois fatores principais contribuem para essa amplificação do viés de popularidade:

  1. Influência de Itens Populares: Itens populares têm efeitos mais fortes sobre as preferências dos vizinhos dos usuários, puxando os usuários para eles e afastando-os de opções menos populares.

  2. Influência de Alta Ordem: Após várias rodadas de processamento, itens populares podem impactar muitos usuários, incorporando ainda mais sua popularidade no processo de recomendação.

À medida que mais camadas de convolução de grafos são adicionadas, o viés do sistema em recomendar itens populares aumenta. Isso resulta em itens de cauda sendo negligenciados e recomendados com menos frequência.

Investigando o Viés

Para lidar com esse problema, analisamos as razões subjacentes para esse viés nas GCNs. Nosso foco é como itens populares exercem mais influência sobre os usuários durante a fase de treinamento. Ao examinar como essas relações são formadas, podemos entender a mecânica em jogo.

Análise Teórica

Fizemos uma análise teórica que destaca como itens populares influenciam as preferências dos usuários. À medida que a GCN processa dados através de várias camadas, itens populares criam um efeito de feedback, puxando os usuários para mais perto deles. Isso significa que, à medida que os usuários recebem recomendações e interagem com itens populares, seus perfis se alinham cada vez mais com essas opções, empurrando os itens de cauda para mais longe.

Essa análise nos ajuda a estabelecer a exata natureza da relação entre as preferências dos usuários e a popularidade dos itens. Propomos um novo método para tratar essa questão com base em nossas descobertas.

Método Proposto: DAP

Nossa solução proposta, chamada DAP (Debias the Amplification of Popularity), tem como objetivo reduzir o efeito do viés de popularidade em sistemas de recomendação baseados em GCNs. O DAP opera durante a fase de inferência, permitindo modificar as previsões do modelo sem precisar re-treinar todo o sistema.

Como o DAP Funciona

O DAP segue algumas etapas chave:

  1. Agrupamento: Começamos analisando as representações dos nós (itens) para agrupá-los com base em suas similaridades. Isso nos permite identificar nós altamente influentes entre os clusters.

  2. Estimativa de Viés: Para cada nó, estimamos o efeito de amplificação de itens populares com base em sua conectividade e na influência exercida durante o processo de recomendação.

  3. Intervenção de Viés: Uma vez que temos uma estimativa do viés, intervimos para controlar seu impacto nas recomendações dos usuários. Isso é feito ajustando as representações dos nós antes de gerar as recomendações finais.

Ao implementar essas etapas, o DAP busca criar um processo de recomendação mais equilibrado que permita que itens de cauda recebam uma exposição justa sem prejudicar significativamente o desempenho dos itens populares.

Avaliação do DAP

Para validar nosso método, realizamos experimentos em vários conjuntos de dados do mundo real. Nosso objetivo é avaliar sua eficácia em melhorar as recomendações de itens de cauda, enquanto mantemos a qualidade geral das recomendações.

Configuração Experimental

Utilizamos três conjuntos de dados com várias histórias de interações entre usuários e itens para avaliar o desempenho do DAP. Os conjuntos de dados nos permitem medir quão bem o DAP pode corrigir o viés de popularidade presente em modelos de GCN, como LightGCN e UltraGCN.

Resultados

Nossos experimentos revelam melhorias significativas nas recomendações de itens de cauda ao aplicar o DAP. Medimos o sucesso do nosso método usando métricas de avaliação padrão, como recall e NDCG, ambas mostraram melhorias marcantes em itens de cauda.

  1. Desempenho Geral: O DAP consistentemente melhorou o desempenho dos modelos de GCN nas recomendações gerais, enquanto forneceu ganhos substanciais para itens de cauda especificamente.

  2. Desempenho por Camada: Ao analisar o desempenho camada por camada, o DAP demonstrou estabilidade, mostrando uma tendência de melhorar a qualidade das recomendações mesmo com mais camadas adicionadas.

  3. Comparação com Outros Métodos: O DAP superou vários outros métodos de desvio que tentaram tratar o viés de popularidade. Ao contrário desses métodos, que muitas vezes recorrem a suprimir itens populares, o DAP corrige as representações dinamicamente, tornando-o mais eficaz para as GCNs.

A Importância do Agrupamento e da Estimativa de Viés

O sucesso do nosso método depende muito dos aspectos de agrupamento e estimativa de viés:

  • Agrupamento ajuda a identificar quais itens impactam significativamente as preferências dos usuários, permitindo que o DAP mire nos nós mais influentes.

  • Estimativa de Viés mede o grau em que itens populares afetam as recomendações. Essa medição precisa permite que o DAP faça ajustes informados nas representações dos nós.

Combinar esses dois elementos permite que o DAP reduza efetivamente a dominância de itens populares, enquanto ainda preserva seu valor no cenário das recomendações.

Conclusão

Em resumo, exploramos como as GCNs amplificam o viés de popularidade nas recomendações e propomos uma solução, o DAP, que aborda efetivamente o problema. Ao analisar teoricamente os mecanismos por trás do viés e implementar um método para corrigi-lo durante a inferência, mostramos que é possível melhorar as recomendações para itens menos populares sem sacrificar o desempenho geral.

Nosso trabalho destaca a importância de entender como os sistemas de recomendação operam e as maneiras como podem ser melhorados para proporcionar melhores experiências aos usuários. À medida que os sistemas de recomendação continuam a evoluir, abordar viéses como o viés de popularidade será crucial para garantir que todos os itens recebam a atenção que merecem.

Trabalho Futuro

Olhando para o futuro, nosso plano é refinar ainda mais o DAP e investigar viéses adicionais que podem existir nos sistemas de recomendação, como viés de posição e viés de exposição. Ao desenvolver soluções mais abrangentes, podemos melhorar as experiências dos usuários e criar sistemas de recomendação mais justos para todos.

Fonte original

Título: How Graph Convolutions Amplify Popularity Bias for Recommendation?

Resumo: Graph convolutional networks (GCNs) have become prevalent in recommender system (RS) due to their superiority in modeling collaborative patterns. Although improving the overall accuracy, GCNs unfortunately amplify popularity bias -- tail items are less likely to be recommended. This effect prevents the GCN-based RS from making precise and fair recommendations, decreasing the effectiveness of recommender systems in the long run. In this paper, we investigate how graph convolutions amplify the popularity bias in RS. Through theoretical analyses, we identify two fundamental factors: (1) with graph convolution (\textit{i.e.,} neighborhood aggregation), popular items exert larger influence than tail items on neighbor users, making the users move towards popular items in the representation space; (2) after multiple times of graph convolution, popular items would affect more high-order neighbors and become more influential. The two points make popular items get closer to almost users and thus being recommended more frequently. To rectify this, we propose to estimate the amplified effect of popular nodes on each node's representation, and intervene the effect after each graph convolution. Specifically, we adopt clustering to discover highly-influential nodes and estimate the amplification effect of each node, then remove the effect from the node embeddings at each graph convolution layer. Our method is simple and generic -- it can be used in the inference stage to correct existing models rather than training a new model from scratch, and can be applied to various GCN models. We demonstrate our method on two representative GCN backbones LightGCN and UltraGCN, verifying its ability in improving the recommendations of tail items without sacrificing the performance of popular items. Codes are open-sourced \footnote{https://github.com/MEICRS/DAP}.

Autores: Jiajia Chen, Jiancan Wu, Jiawei Chen, Xin Xin, Yong Li, Xiangnan He

Última atualização: 2023-05-24 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2305.14886

Fonte PDF: https://arxiv.org/pdf/2305.14886

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes