Simple Science

Ciência de ponta explicada de forma simples

# Informática# Recuperação de informação# Aprendizagem de máquinas

Melhorando as Previsões de Taxa de Clique com GLSM

Um novo modelo melhora as previsões do comportamento de clique dos usuários online.

― 7 min ler


GLSM Melhora Previsões deGLSM Melhora Previsões deCTRde forma eficaz.Novo modelo aumenta as taxas de cliques
Índice

A previsão da Taxa de Cliques (CTR) é sobre adivinhar quão provável é que alguém clique em um item online. Isso é importante para empresas que querem oferecer recomendações e anúncios melhores. Entender o que os usuários gostam com base nas ações deles é crucial. Os usuários têm interesses tanto de longo prazo (o que eles costumam gostar ao longo do tempo) quanto de curto prazo (o que eles podem gostar agora). Muitos pesquisadores e empresas estão buscando maneiras de entender melhor esses comportamentos dos usuários, mas ainda existem desafios.

O Problema

Existem dois problemas principais com os métodos atuais. Primeiro, usar regras para encontrar informações de comportamentos de longo prazo pode perder detalhes importantes. Segundo, olhar apenas para um tipo de ação para comportamentos de curto prazo pode misturar informações e criar ruído. Isso significa que as empresas podem perder a chance de entender o que os usuários realmente querem.

Nossa Solução

Para resolver esses problemas, apresentamos um novo modelo chamado Modelo de Interesses de Longo e Curto Prazo Baseado em Gráficos (GLSM). Esse modelo usa um layout de gráfico para capturar o comportamento do usuário ao longo do tempo. Ele tem duas partes: uma para comportamento de longo prazo e outra para comportamento de curto prazo. O modelo também possui uma forma de combinar informações de ambos os tipos de comportamento, levando a previsões melhores.

Como Funciona

O GLSM é construído em três componentes-chave:

  1. Recuperação de Interesses de Longo Prazo Baseada em Gráficos: Essa parte usa uma estrutura de gráfico para encontrar interesses de longo prazo dos usuários de forma eficiente. Ela identifica os aspectos importantes do comportamento do usuário sem se distrair com informações irrelevantes.

  2. Reconhecimento de Multi-intenção de Curto Prazo: Essa parte analisa os interesses de curto prazo dos usuários em várias situações. Isso é crucial porque um usuário pode ter preferências diferentes dependendo do que está fazendo ou onde está.

  3. Fusão de Interesses de Longo e Curto Prazo: Este componente combina interesses de longo e curto prazo de uma forma personalizada, entendendo que diferentes usuários têm necessidades diferentes.

Benefícios da Nossa Abordagem

Nosso modelo mostrou resultados promissores em experimentos. Ele pode prever cliques de forma mais precisa do que muitos métodos existentes. Realizamos testes usando conjuntos de dados do mundo real, e o GLSM superou outros modelos por uma margem significativa.

Recuperação de Comportamento de Longo Prazo

A primeira parte do GLSM foca na recuperação de comportamento de longo prazo. Muitos usuários realizam várias ações ao longo do tempo, o que às vezes pode complicar as coisas. O GLSM cria um gráfico dessas ações, encontrando as mais relevantes para adicionar ao modelo enquanto ignora o ruído. A recuperação começa a partir de nós importantes que representam os interesses do usuário, permitindo que vejamos o que mais importa para ele.

O objetivo aqui é simplificar a sequência de ações do usuário ao longo do tempo em informações úteis que podem aumentar as previsões de CTR. Ele organiza o comportamento do usuário em clusters com base em semelhanças. O modelo observa como essas ações se relacionam com o que o usuário gosta, usando um gráfico para descobrir quais comportamentos estão mais conectados aos interesses atuais.

Reconhecimento de Multi-intenção de Curto Prazo

Para os interesses de curto prazo, o GLSM divide as ações dos usuários em diferentes cenários. Por exemplo, como um usuário se comporta de manhã pode ser diferente do que ele faz durante o almoço ou jantar. Isso é necessário porque a mesma pessoa pode querer coisas diferentes dependendo da hora do dia.

O modelo usa uma GRU (Unidade Recorrente Gated) para capturar o fluxo de interesses do usuário. Em vez de focar em um único tipo de ação, ele reconhece que os usuários podem ter várias intenções ao mesmo tempo. Por exemplo, um usuário pode estar olhando opções de comida enquanto planeja suas refeições do dia.

Ao detalhar as ações de curto prazo dos usuários dessa forma, o GLSM captura uma imagem mais detalhada dos interesses deles, ajudando a extrair comportamentos relevantes sem misturar ações não relacionadas.

Combinando Interesses de Longo e Curto Prazo

A próxima etapa é misturar os interesses de longo e curto prazo de forma eficaz. Nem todo comportamento de usuário tem o mesmo peso; um interesse de longo prazo estável pode ser mais influente do que uma vontade de curto prazo. O GLSM usa uma abordagem personalizada para criar um equilíbrio entre esses dois lados.

Por exemplo, se um usuário compra sapatos com frequência, esse interesse de longo prazo pesará mais do que um interesse recente em roupas de festa. O modelo aprende a ajustar esses pesos com base nas características do usuário, resultando em previsões de itens mais relevantes.

Implementação no Mundo Real

Implementar o GLSM em um sistema ao vivo traz seus próprios desafios. Serviços online precisam responder rapidamente, muitas vezes em apenas milissegundos, enquanto lidam com grandes quantidades de dados de comportamento do usuário. Para lidar com isso, o GLSM executa um sistema de recuperação rápida que funciona ao lado de outras partes do processo de recomendação.

Ao organizar eficientemente as ações históricas dos usuários, o GLSM reduz o tempo e os recursos necessários para a previsão de CTR. Ele faz o trabalho pesado da recuperação de comportamento com antecedência, facilitando a extração de informações relevantes quando os usuários interagem com o sistema.

Resultados Experimentais

Nós avaliamos o GLSM em comparação com muitos modelos de referência usando conjuntos de dados públicos e industriais. O modelo demonstrou desempenho superior em várias métricas. Não apenas o GLSM melhorou as taxas de cliques, mas também aumentou o engajamento geral dos usuários.

Por exemplo, testamos o GLSM com dados de um aplicativo móvel popular, onde ele alcançou um aumento significativo na CTR e na receita total. Esses achados mostram que combinar interesses de longo e curto prazo pode levar a recomendações melhores, resultando em maior satisfação do usuário e aumento do valor para os negócios.

Conclusão

Em resumo, o Modelo de Interesses de Longo e Curto Prazo Baseado em Gráficos oferece uma nova maneira de entender o comportamento do usuário em sistemas de recomendação online. Ao focar separadamente nas memórias de longo prazo e nas intenções de curto prazo e, em seguida, mesclá-las de forma inteligente, o GLSM consegue capturar melhor as complexidades dos interesses dos usuários do que os modelos existentes.

Através de técnicas de recuperação eficazes e uma compreensão aguçada dos cenários dos usuários, ele oferece uma ferramenta poderosa para melhorar os sistemas de recomendação online. À medida que as plataformas online evoluem, modelos como o GLSM ajudam a garantir que as empresas possam atender melhor às necessidades dos usuários e melhorar sua experiência digital geral.

Fonte original

Título: Graph Based Long-Term And Short-Term Interest Model for Click-Through Rate Prediction

Resumo: Click-through rate (CTR) prediction aims to predict the probability that the user will click an item, which has been one of the key tasks in online recommender and advertising systems. In such systems, rich user behavior (viz. long- and short-term) has been proved to be of great value in capturing user interests. Both industry and academy have paid much attention to this topic and propose different approaches to modeling with long-term and short-term user behavior data. But there are still some unresolved issues. More specially, (1) rule and truncation based methods to extract information from long-term behavior are easy to cause information loss, and (2) single feedback behavior regardless of scenario to extract information from short-term behavior lead to information confusion and noise. To fill this gap, we propose a Graph based Long-term and Short-term interest Model, termed GLSM. It consists of a multi-interest graph structure for capturing long-term user behavior, a multi-scenario heterogeneous sequence model for modeling short-term information, then an adaptive fusion mechanism to fused information from long-term and short-term behaviors. Comprehensive experiments on real-world datasets, GLSM achieved SOTA score on offline metrics. At the same time, the GLSM algorithm has been deployed in our industrial application, bringing 4.9% CTR and 4.3% GMV lift, which is significant to the business.

Autores: Huinan Sun, Guangliang Yu, Pengye Zhang, Bo Zhang, Xingxing Wang, Dong Wang

Última atualização: 2023-06-05 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.10028

Fonte PDF: https://arxiv.org/pdf/2306.10028

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes