Estimando o Viés de Posição na Publicidade Online
Uma nova abordagem melhora a estimativa de viés de posição usando embeddings de itens.
― 6 min ler
Índice
A publicidade online é uma parte chave do e-commerce, onde o posicionamento dos anúncios pode afetar muito a frequência com que eles são clicados. Quando os usuários veem anúncios, as suas localizações podem fazer com que cliquem em alguns mais do que em outros. Essa tendência é conhecida como Viés de Posição. Entender e estimar esse viés é importante para melhorar a eficácia dos anúncios. No entanto, essa tarefa pode ser desafiadora, especialmente quando os dados são limitados.
O Desafio da Estimativa do Viés de Posição
O viés de posição fica evidente quando se analisa com que frequência os usuários clicam em anúncios em várias posições. Por exemplo, geralmente, os usuários podem ter mais chances de clicar em anúncios no topo de uma página da web em comparação com os de posições mais abaixo. Esse comportamento pode levar a conclusões enganosas se não for tratado corretamente. Os dados de cliques coletados dos usuários muitas vezes incluem esse viés, tornando importante desenvolver maneiras de estimá-lo com precisão.
Em muitos cenários de publicidade, a ordem e a posição dos anúncios são predefinidas, resultando em combinações limitadas de itens e posições nos dados coletados. Essa restrição leva a um conjunto de dados escasso, onde algumas combinações de itens e posições não aparecem de jeito nenhum. Como resultado, estimar o viés de posição com precisão se torna mais difícil.
Métodos Atuais
Existem vários métodos para estimar o viés de posição. Uma abordagem usa um modelo estatístico que requer uma variedade de dados para funcionar de forma eficaz. No entanto, na publicidade do mundo real, os profissionais de marketing costumam exibir anúncios em uma ordem fixa, reduzindo a diversidade de dados disponíveis para essa estimativa. Como resultado, muitos desses métodos podem não fornecer estimativas confiáveis ao lidar com conjuntos de dados escassos.
Outros modelos foram propostos para estimar melhor o viés de posição, incluindo aqueles que usam técnicas de randomização. Esses modelos visam criar dados mais balanceados variando as posições dos anúncios. No entanto, eles podem ser caros e nem sempre práticos em aplicações do mundo real.
Solução Proposta
Para lidar com o problema da escassez de dados, uma nova abordagem foi proposta que incorpora Embeddings de Itens. Embeddings de itens envolvem representar itens de uma maneira que capture suas semelhanças. Ao criar representações dos itens que refletem o quão parecidos eles são, podemos estimar valores ausentes nos dados de posição.
Esse novo método foca em usar semelhanças conhecidas entre itens para prever cliques em posições onde nenhum dado foi coletado. Por exemplo, se dois itens são semelhantes, o conhecimento sobre um item pode ajudar a estimar os cliques esperados para o outro item em diferentes posições.
A Importância dos Embeddings de Itens
Os embeddings de itens são importantes porque oferecem uma forma de conectar dados de itens quando combinações específicas de itens e posições estão ausentes. Essa conexão permite uma estimativa mais precisa do viés de posição. O método introduzido usa técnicas populares como Indexação Semântica Latente (LSI) e Autoencoders Variacionais (VAE) para criar esses embeddings de itens.
O objetivo é preencher as lacunas nos dados. Estimando como seriam os padrões de cliques para itens em posições onde nenhum clique é observado, conseguimos fortalecer a base para estimar o viés de posição.
Experimentos e Descobertas
Para avaliar a eficácia da nova abordagem, foram realizados extensos experiments em dois conjuntos de dados. Um conjunto de dados é público e contém uma grande quantidade de dados de interação do usuário, enquanto o outro vem de uma plataforma de e-commerce bem conhecida.
Os experimentos avaliaram o quão precisamente o método proposto poderia estimar o viés de posição em conjuntos de dados escassos. Em um teste, o novo método foi comparado a abordagens tradicionais. Os resultados mostraram que usar embeddings de itens melhorou a precisão das estimativas de viés de posição. Especificamente, LSI superou VAE em termos de precisão, indicando o valor de usar esses embeddings na estimativa do viés de posição.
Avaliações adicionais também examinaram o quão bem o método poderia melhorar as recomendações de classificação. Ao aplicar os valores de viés de posição aprendidos nos experimentos, os pesquisadores analisaram os impactos em quão eficazmente os itens eram classificados e sugeridos aos usuários. Os resultados indicaram melhorias notáveis no desempenho das recomendações devido às estimativas mais precisas do viés de posição.
Conclusão
O campo da estimativa do viés de posição enfrentou desafios, especialmente ao lidar com conjuntos de dados escassos. No entanto, métodos inovadores que incorporam embeddings de itens apresentam uma solução eficaz. Ao focar nas semelhanças entre os itens, a abordagem proposta é capaz de superar limitações na disponibilidade de dados.
Como resultado, essa pesquisa não só contribui com insights valiosos sobre como o viés de posição pode ser estimado de forma mais eficaz, mas também melhora o desempenho geral dos sistemas de recomendação no e-commerce. As implicações de entender melhor o viés de posição são significativas, levando a estratégias de colocação de anúncios melhores e, em última análise, a uma experiência do usuário melhor em ambientes online.
Direções Futuras
Existem várias avenidas para trabalhos futuros nessa área. Uma possível direção poderia ser investigar métodos adicionais para criar embeddings de itens que melhorem ainda mais a estimativa do viés de posição. Além disso, experimentar com diferentes tipos de conjuntos de dados pode render insights e melhorias ainda mais amplas.
Além disso, incorporar dados demográficos dos usuários, padrões comportamentais e fatores temporais na análise poderia levar a uma compreensão mais holística de como o viés de posição afeta as interações dos usuários com os anúncios. Explorar aplicações cross-domain desse método também poderia trazer valor em diferentes indústrias onde a publicidade online é prevalente.
Resumindo, à medida que o e-commerce continua a crescer, melhorar as técnicas para estimar o viés de posição será essencial para otimizar os anúncios e aprimorar a experiência do usuário. Os achados dessa pesquisa abrem caminho para estratégias de publicidade mais precisas e eficientes em um cenário digital cada vez mais competitivo.
Título: Position Bias Estimation with Item Embedding for Sparse Dataset
Resumo: Estimating position bias is a well-known challenge in Learning to Rank (L2R). Click data in e-commerce applications, such as targeted advertisements and search engines, provides implicit but abundant feedback to improve personalized rankings. However, click data inherently includes various biases like position bias. Based on the position-based click model, Result Randomization and Regression Expectation-Maximization algorithm (REM) have been proposed to estimate position bias, but they require various paired observations of (item, position). In real-world scenarios of advertising, marketers frequently display advertisements in a fixed pre-determined order, which creates difficulties in estimation due to the limited availability of various pairs in the training data, resulting in a sparse dataset. We propose a variant of the REM that utilizes item embeddings to alleviate the sparsity of (item, position). Using a public dataset and internal carousel advertisement click dataset, we empirically show that item embedding with Latent Semantic Indexing (LSI) and Variational Auto-Encoder (VAE) improves the accuracy of position bias estimation and the estimated position bias enhances Learning to Rank performance. We also show that LSI is more effective as an embedding creation method for position bias estimation.
Autores: Shion Ishikawa, Yun Ching Liu, Young-Joo Chung, Yu Hirate
Última atualização: 2024-03-11 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2305.13931
Fonte PDF: https://arxiv.org/pdf/2305.13931
Licença: https://creativecommons.org/publicdomain/zero/1.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.