Melhorando o Ranking de Busca nas Compras Online
Combinando dados de curto e longo prazo pra melhorar os resultados de busca de produtos.
Qi Liu, Atul Singh, Jingbo Liu, Cun Mu, Zheng Yan, Jan Pedersen
― 7 min ler
Índice
- O Desafio das Janelas Temporais em Recursos Comportamentais
- Analisando as Janelas Temporais
- O Primeiro Teste: Janelas Longas vs. Curtas
- O Segundo Teste: Combinando Janelas Longas e Curtas
- A Melhor Abordagem: Integrando Recursos Verticais
- Testando o Modelo Integrado
- Conclusão
- Trabalho Futuro
- Fonte original
- Ligações de referência
Fazer compras online agora é algo normal na vida de muita gente. Tem várias vantagens, tipo a conveniência, uma variedade enorme de produtos, preços mais em conta e fácil acesso pelo celular. Com mais produtos disponíveis online, ter um bom sistema de classificação de busca é super importante. Esse sistema ajuda os clientes a encontrarem os produtos mais relevantes rapidinho.
No coração desses sistemas de classificação tá um modelo que usa aprendizado de máquina. Esses modelos captam vários sinais diferentes pra decidir quais produtos devem aparecer no topo dos resultados de busca. Esses sinais podem vir de várias fontes, incluindo o comportamento dos usuários, o que eles querem comprar, detalhes dos produtos e a reputação dos vendedores.
Entre todos esses sinais, a maneira como os clientes interagem com os produtos-tipo cliques, compras e adicionar itens ao carrinho-é bem importante. Estudo mostram que esse tipo de feedback dos clientes é chave pra decidir como os produtos são classificados. Os clientes são os melhores juízes sobre a relevância dos produtos nas suas buscas, especialmente quando isso resulta em compras. Além disso, coletar esse feedback é barato e fácil, tornando esses sinais comportamentais o núcleo dos Modelos de Classificação.
O Desafio das Janelas Temporais em Recursos Comportamentais
Apesar da pesquisa já feita sobre o uso de recursos comportamentais na classificação, um problema significativo ainda tá sem solução: determinar as melhores janelas temporais para esses recursos. Janelas temporais se referem aos períodos em que os dados de engajamento dos clientes são coletados para avaliar a relevância dos produtos. Encontrar a janela certa é crucial pra usar esses recursos de maneira eficaz nas classificações.
Esse artigo traz insights da experiência prática na indústria e analisa como diferentes janelas temporais podem afetar as classificações de busca dos produtos. Ele investiga especificamente os efeitos de janelas longas e curtas e propõe um método pra combinar os dois tipos pra resultados melhores. A eficácia dessa abordagem combinada é testada com dados reais de compras online.
Analisando as Janelas Temporais
Ao olhar como diferentes tamanhos de janelas temporais podem impactar modelos de classificação, consideramos três tipos principais de engajamento do usuário: taxas de clique, taxas de adicionar ao carrinho (ATC) e taxas de pedido. Essas taxas são calculadas com base no comportamento do cliente durante períodos específicos.
Usar uma janela temporal mais longa permite capturar o Comportamento a Longo Prazo, que nos informa sobre os interesses contínuos dos clientes. Porém, pode perder as tendências mais recentes. Por outro lado, uma janela mais curta se foca nos comportamentos atuais, que podem ajudar a refletir mudanças nas tendências de compras, mas podem não mostrar os interesses duradouros dos clientes. Cada abordagem tem suas próprias vantagens e desvantagens.
Pra analisar os efeitos desses dois tipos de recursos comportamentais, definimos uma janela de lookback longa como dois anos e uma curta como um mês. Criamos quatro modelos de classificação pra testar esses diferentes setups.
- Modelo Baseline: Usa apenas recursos comportamentais de 2 anos.
- Modelo A: Usa apenas recursos comportamentais de 1 mês.
- Modelo B: Usa tanto recursos de 2 anos quanto de 1 mês.
- Modelo C: Incorpora os dois tipos de recursos junto com informações específicas de consultas.
O Primeiro Teste: Janelas Longas vs. Curtas
No primeiro conjunto de testes, comparamos o desempenho do Modelo Baseline (recursos comportamentais de 2 anos) com o Modelo A (recursos comportamentais de 1 mês). O objetivo aqui é entender os impactos distintos dos dois tamanhos de janelas temporais.
Os resultados mostram que enquanto o Modelo A geralmente se sai pior que o Modelo Baseline, há diferenças interessantes entre as categorias de produtos. Por exemplo, os recursos de curto prazo tiveram desempenho melhor em categorias como Eletrônicos, Brinquedos e Produtos Sazonais. Por outro lado, os recursos de longo prazo funcionaram melhor em categorias mais estáveis, como Alimentos e Produtos de Consumo.
Essa descoberta sugere que ambos os tipos de recursos têm vantagens únicas, tornando atraente encontrar uma maneira de combiná-los pra resultados ótimos.
O Segundo Teste: Combinando Janelas Longas e Curtas
Aproveitando os insights do primeiro teste, configuramos um segundo teste comparando o Modelo Baseline com o Modelo B, que inclui tanto recursos de longo quanto de curto prazo. Aqui, esperamos que a combinação desses recursos traga resultados ainda melhores.
No entanto, os resultados indicam que combinar esses recursos não teve um bom desempenho geral. Em várias categorias, incluindo Alimentos e Produtos de Consumo, o desempenho até caiu. Isso sugere que simplesmente fundir os dois tipos de recursos pode diluir a eficácia deles.
Pra ilustrar, na categoria de Alimentos, as forças do recurso mais longo foram reduzidas quando combinadas com recursos mais curtos que não adicionaram valor naquele contexto específico.
A Melhor Abordagem: Integrando Recursos Verticais
Percebemos que diferentes categorias de produtos respondem de maneiras únicas às tendências no comportamento do cliente. Por exemplo, itens de moda são geralmente influenciados por tendências atuais, enquanto itens alimentícios tendem a ser mais estáveis ao longo do tempo.
Pra melhorar a performance do modelo combinado, sugerimos adicionar uma camada de contexto de consulta, especificamente através de recursos verticais. Esses recursos informam o modelo de classificação sobre como usar melhor tanto recursos comportamentais de longo quanto de curto prazo pra diferentes buscas de produtos.
O novo modelo, Modelo C, incorpora esses recursos verticais junto com os dois tipos de dados comportamentais. Isso permite que o modelo adapte seu uso de recursos baseado no contexto específico da compra.
Testando o Modelo Integrado
Pra avaliar a nova abordagem, fazemos um teste A/B final comparando o Modelo C com o Modelo Baseline original. Este teste dura duas semanas e analisa métricas chave relacionadas ao engajamento e satisfação do cliente.
Os resultados revelam uma melhora significativa em várias métricas, confirmando que usar uma combinação de ambos os recursos comportamentais junto com insights específicos de consultas pode aprimorar a experiência geral de compra. Notavelmente, essa abordagem também ajuda a resolver problemas que surgem em situações de cold-start quando novos produtos são adicionados ao catálogo.
Conclusão
Neste estudo, introduzimos um modelo de classificação de busca que combina efetivamente tanto recursos comportamentais de longo quanto de curto prazo com informações específicas verticais. Este modelo é projetado pra capturar o engajamento do cliente ao longo de diferentes períodos, garantindo que o sistema de classificação responda às necessidades atuais de compra.
Os testes extensivos mostram que o novo modelo integrado supera setups anteriores que dependiam apenas de um tipo de recurso comportamental. Essa melhoria não só ajuda a atender melhor às necessidades dos clientes, mas também estabelece as bases para futuras melhorias nos sistemas de classificação de busca.
Trabalho Futuro
Daqui pra frente, há planos de ampliar o escopo do modelo de busca. Futuras iterações vão considerar janelas temporais adicionais-como uma semana e um ano-pra capturar uma gama mais ampla de padrões de engajamento do cliente. Além disso, a equipe pretende introduzir sinais mais detalhados no nível das consultas, o que permitirá um melhor ajuste dos recursos comportamentais pra melhorar ainda mais a experiência do cliente.
Título: Long or Short or Both? An Exploration on Lookback Time Windows of Behavioral Features in Product Search Ranking
Resumo: Customer shopping behavioral features are core to product search ranking models in eCommerce. In this paper, we investigate the effect of lookback time windows when aggregating these features at the (query, product) level over history. By studying the pros and cons of using long and short time windows, we propose a novel approach to integrating these historical behavioral features of different time windows. In particular, we address the criticality of using query-level vertical signals in ranking models to effectively aggregate all information from different behavioral features. Anecdotal evidence for the proposed approach is also provided using live product search traffic on Walmart.com.
Autores: Qi Liu, Atul Singh, Jingbo Liu, Cun Mu, Zheng Yan, Jan Pedersen
Última atualização: 2024-09-25 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2409.17456
Fonte PDF: https://arxiv.org/pdf/2409.17456
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.