Melhorando Sistemas de Recomendação com Nova Abordagem Neural
Um novo método melhora como os sistemas aprendem as preferências dos usuários de forma eficiente.
― 8 min ler
Índice
Sistemas de Recomendação são ferramentas que ajudam as pessoas a encontrar itens ou conteúdos que podem gostar com base nos seus interesses. Eles são usados em várias plataformas online, como serviços de streaming e sites de e-commerce. Um bom sistema de recomendação não só sugere itens populares, mas também traz conteúdos novos e relevantes para os usuários. No entanto, os métodos tradicionais costumam ter dificuldades para descobrir o que os usuários podem gostar que ainda não viram antes. Essa limitação se deve à dependência de dados passados e interesses conhecidos dos usuários.
Nos últimos anos, algumas melhorias foram feitas usando um método chamado bandits contextuais. Essa técnica permite que os sistemas explorem novas opções enquanto ainda usam o que já sabem. Porém, essas abordagens avançadas podem ser muito exigentes em termos de recursos computacionais, tornando difícil o uso em situações do dia a dia.
Esse trabalho busca criar uma nova forma Eficiente de usar esses métodos em sistemas de recomendação. O objetivo é facilitar para que o sistema aprenda sobre o que os usuários gostam, mantendo os custos computacionais baixos.
A Necessidade de Melhores Sistemas de Recomendação
Sistemas de recomendação desempenham um papel fundamental em como as pessoas encontram informações no vasto mundo da internet. Eles ajudam a personalizar conteúdos para usuários individuais, melhorando sua experiência geral. Tradicionalmente, esses sistemas usavam algoritmos de aprendizado supervisionado, que analisam grandes quantidades de dados para descobrir as preferências dos usuários. Mas esses métodos tendem a se ater a tópicos familiares e não são bons em encontrar novos interesses para os usuários.
Muitos sistemas de recomendação focam apenas nos interesses conhecidos dos usuários, o que os torna menos eficazes ao sugerir novos conteúdos. Essa abordagem pode resultar em uma gama estreita de recomendações, perdendo itens potencialmente interessantes para os usuários. A capacidade de um sistema de descobrir preferências ocultas dos usuários é essencial para o sucesso a longo prazo.
Explorando o Aprendizado de Bandits Contextuais
O conceito de Exploração em sistemas de recomendação vem de um campo conhecido como aprendizado de bandits. Nesse contexto, o sistema atua como um agente que interage com os usuários. Cada usuário representa um contexto diferente, e cada sugestão feita é considerada uma ação. Algoritmos de bandit, como amostragem de Thompson e limite superior de confiança (UCB), permitem que os sistemas explorem novas opções enquanto fazem recomendações.
Embora a pesquisa tenha mostrado que esses métodos podem funcionar bem em testes pequenos, sistemas de recomendação do mundo real exigem abordagens que consigam lidar com quantidades maiores de dados e situações mais complexas. Abordagens de bandit baseadas em redes neurais oferecem mais flexibilidade, mas podem ser muito pesadas em termos de recursos para uso prático.
Um desafio significativo nesses métodos é estimar a incerteza de forma eficiente. Um agente precisa saber o que não sabe para guiar sua exploração de maneira eficaz. Embora métodos existentes consigam isso, eles costumam exigir muitos cálculos, limitando sua aplicação prática.
Apresentando a Recomendação Neural Epistêmica
Para lidar com esse desafio, propomos uma nova arquitetura de rede neural chamada Recomendação Neural Epistêmica (ENR). Esse design visa facilitar para que sistemas de recomendação aprendam sobre os usuários sem usar muitos recursos.
Representações Informatórias
Uma parte essencial de como a ENR funciona é criar representações eficazes tanto dos usuários quanto do conteúdo. Isso inclui três elementos principais: a representação da ação (a sugestão), a representação do contexto (o usuário) e como esses dois interagem.
Para alcançar isso, os dados brutos de características dos usuários e itens são transformados em formas mais úteis. Esse processo ajuda a garantir que o sistema possa analisar e aprender de forma eficaz com os dados que recebe. Fazendo isso de maneira eficaz, o sistema consegue entender melhor a conexão entre usuários e o conteúdo que eles podem gostar.
Melhorando a Exploração
A ENR utiliza as informações coletadas de usuários e conteúdo para fazer palpites melhores sobre o que pode interessar a um usuário a seguir. Ao amostrar uma variedade de possibilidades, o sistema pode oferecer sugestões mais diversas. Essa exploração é crucial porque ajuda o sistema a aprender sobre novos interesses que podem não ter sido considerados antes.
A arquitetura permite que o sistema utilize a estimativa de incerteza de forma eficiente. Isso significa que, quando o sistema não tem certeza sobre a preferência de um usuário, pode optar por explorar diferentes opções em vez de se prender ao conteúdo familiar. Essa capacidade pode levar a experiências de usuário mais ricas e personalizadas.
Experimentando com Dados do Mundo Real
Realizamos uma série de experimentos para testar o quão bem a ENR se sai. Esses experimentos utilizaram grandes conjuntos de dados com milhões de interações de usuários reais, o que proporcionou uma forma valiosa de avaliar a eficácia do sistema em cenários do mundo real.
Os testes compararam a ENR com vários métodos existentes, incluindo estratégias tradicionais de bandit como amostragem de Thompson, UCB e diversas abordagens de redes neurais. Ao observar o desempenho da ENR, podemos ver suas vantagens tanto em exploração quanto em eficiência.
Resultados do Conjunto de Dados MIND
Um dos experimentos chave envolveu o conjunto de dados MIND, que vem de um sistema de recomendação de notícias. Esse conjunto inclui registros detalhados das interações dos usuários, permitindo que rastreássemos quão bem diferentes sistemas se saem ao sugerir artigos.
Neste experimento, a ENR mostrou uma melhoria significativa em relação a outros métodos em termos de taxas de cliques e avaliações dos usuários. Ela atingiu esses resultados exigindo menos interações para aprender sobre as preferências dos usuários. Essa vantagem é particularmente importante porque significa que os usuários são menos sobrecarregados, tornando o sistema mais amigável.
Resultados do Conjunto de Dados KuaiRec
Outro conjunto de dados importante testado foi o KuaiRec, que apresenta interações quase completas entre usuários e itens. Esse conjunto abrangente nos permitiu avaliar quão bem a ENR poderia se adaptar a cenários da vida real com uma ampla variedade de recomendações disponíveis.
Mais uma vez, a ENR superou as outras estratégias. Demonstrou um desempenho forte tanto em interações dos usuários quanto em avaliações, destacando sua eficácia em ambientes do mundo real. Os resultados indicam que a ENR pode generalizar efetivamente a partir de interações conhecidas dos usuários para fazer recomendações precisas para conteúdos não vistos.
Principais Descobertas e Implicações
Os experimentos mostram claramente que a ENR oferece uma forma mais eficiente de conduzir exploração em sistemas de recomendação. Ao fornecer uma arquitetura escalável que requer menos recursos, a ENR abre portas para seu uso em diversas aplicações.
A capacidade da ENR de aprimorar a personalização enquanto lida com Incertezas de forma eficiente é um avanço significativo no campo. Essa melhoria tem implicações sobre como as empresas podem adotar sistemas de recomendação avançados sem incorrer em altos custos computacionais.
Além disso, os resultados de ambos os conjuntos de dados sugerem que a ENR não é apenas uma solução teórica; ela é prática e aplicável aos desafios do mundo real que os sistemas de recomendação enfrentam hoje.
Conclusão
Em resumo, o desenvolvimento da ENR representa um avanço na evolução dos sistemas de recomendação. Ao integrar estratégias de exploração com foco na eficiência computacional, a ENR fornece uma ferramenta valiosa para melhorar como os usuários descobrem novos conteúdos.
A pesquisa destaca o potencial de combinar algoritmos avançados com arquiteturas de redes neurais eficazes para enfrentar desafios antigos na personalização. Trabalhos futuros podem construir sobre essa base, refinando ainda mais a abordagem e explorando novas aplicações.
A esperança é que mais empresas e plataformas adotem esses métodos inovadores, levando a experiências de usuário mais ricas e interações mais satisfatórias com conteúdos digitais. À medida que a tecnologia continua a evoluir, ferramentas como a ENR serão essenciais para navegar no vasto panorama de interesses e preferências dos usuários.
Título: Scalable Neural Contextual Bandit for Recommender Systems
Resumo: High-quality recommender systems ought to deliver both innovative and relevant content through effective and exploratory interactions with users. Yet, supervised learning-based neural networks, which form the backbone of many existing recommender systems, only leverage recognized user interests, falling short when it comes to efficiently uncovering unknown user preferences. While there has been some progress with neural contextual bandit algorithms towards enabling online exploration through neural networks, their onerous computational demands hinder widespread adoption in real-world recommender systems. In this work, we propose a scalable sample-efficient neural contextual bandit algorithm for recommender systems. To do this, we design an epistemic neural network architecture, Epistemic Neural Recommendation (ENR), that enables Thompson sampling at a large scale. In two distinct large-scale experiments with real-world tasks, ENR significantly boosts click-through rates and user ratings by at least 9% and 6% respectively compared to state-of-the-art neural contextual bandit algorithms. Furthermore, it achieves equivalent performance with at least 29% fewer user interactions compared to the best-performing baseline algorithm. Remarkably, while accomplishing these improvements, ENR demands orders of magnitude fewer computational resources than neural contextual bandit baseline algorithms.
Autores: Zheqing Zhu, Benjamin Van Roy
Última atualização: 2023-08-18 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2306.14834
Fonte PDF: https://arxiv.org/pdf/2306.14834
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.