Uma Nova Abordagem para Previsão de Taxa de Clique
Explorando o framework de Classificação de Confiança pra melhorar as previsões de anúncios.
― 7 min ler
Índice
No mundo da publicidade online, prever se um usuário vai clicar em um anúncio é super importante pra melhorar a eficácia do marketing. Esse processo é conhecido como previsão da Taxa de Cliques (CTR). Com a quantidade crescente de dados e a necessidade de atualizar modelos com frequência, os pesquisadores têm buscado maneiras melhores de fazer essas previsões.
O Desafio das Mudanças nos Dados e Modelos
Em aplicações da vida real, tanto os dados quanto os modelos usados para as previsões mudam o tempo todo. Os dados podem mudar por causa do comportamento dos usuários, enquanto os modelos são atualizados pra acompanhar essas mudanças. Por causa disso, as empresas costumam re-treinar seus modelos usando todos os dados disponíveis ou só os dados mais recentes. No entanto, quando há mudanças significativas em como os modelos são treinados, isso pode afetar negativamente o desempenho dos sistemas online.
Uma Nova Estrutura para Previsões Melhores
Pra enfrentar esses desafios, foi proposta uma nova estrutura chamada Classificação de Confiança. Essa estrutura foca em melhorar as previsões dos modelos tratando-as como rankings, ao invés de confiar só em métodos tradicionais. Em vez de usar funções de perda padrão, que geralmente medem taxas de erro, essa nova abordagem procura otimizar a classificação das saídas do modelo.
A ideia principal por trás da Classificação de Confiança é ajustar como os modelos aprendem com previsões passadas pra melhorar seu desempenho futuro. Especificamente, o objetivo é aprimorar como os modelos fazem previsões focando no desempenho relativo de diferentes modelos, em vez de apenas na precisão absoluta deles.
A Metodologia por Trás da Classificação de Confiança
Na prática, a estrutura da Classificação de Confiança divide o processo de previsão da CTR em três etapas principais:
Treinamento Offline: É aqui que os modelos são construídos usando dados históricos. O objetivo é ajustar os modelos pra que façam previsões precisas com base nas interações passadas dos usuários.
Serviço Online: Depois do treinamento, os modelos vão pra ativa e começam a fazer previsões pra usuários reais. O modelo é implementado pra exibir anúncios pros usuários com base nos dados atuais, mas não saberá os resultados dessas previsões até que os usuários cliquem nos anúncios ou os ignorem.
Aprendizado Online: Essa etapa envolve atualizar continuamente o modelo com novos dados conforme eles chegam. À medida que mais dados de usuários são coletados, o modelo é re-treinado pra refletir melhor os interesses e comportamentos atuais dos usuários.
Importância das Previsões Anteriores
Um aspecto chave da abordagem da Classificação de Confiança é o valor atribuído às previsões anteriores feitas pelo modelo. Em vez de ignorar as saídas passadas, a estrutura as usa como um insumo valioso durante o re-treinamento. Isso é importante porque essas previsões podem oferecer insights sobre como o desempenho do modelo se relaciona com os resultados reais.
Treinamento pra Melhor Desempenho
Pra tornar as previsões mais eficazes, a estrutura utiliza um método conhecido como Destilação de Conhecimento. Isso envolve treinar um modelo menor e mais simples (o aluno) pra imitar um modelo maior e mais complexo (o professor). O objetivo é que o modelo aluno aprenda com as previsões do professor. No entanto, pra que esse método funcione melhor, o modelo professor precisa consistentemente superar o modelo aluno.
No contexto da previsão de CTR, os pesquisadores queriam responder a uma pergunta importante: como um modelo pode ser treinado pra performar melhor do que o modelo atualmente em uso? A solução deles está na estrutura da Classificação de Confiança, que permite otimizar diferentes modelos pra alcançar melhores pontuações de ranking em vez de confiar em funções de perda tradicionais, como a cross-entropy.
Benefícios da Abordagem da Classificação de Confiança
Existem várias vantagens em usar a Classificação de Confiança pra prever a CTR:
Melhor Adequação para Cenários da Vida Real: As pontuações de ranking podem oferecer um reflexo mais preciso do desempenho do modelo ao lidar com a distribuição de dados do mundo real.
Adaptabilidade à Complexidade do Modelo: A estrutura pode lidar com diferentes tipos de modelos sem ser limitada pela sua complexidade. Essa flexibilidade significa que pode funcionar tanto com modelos mais simples quanto com os mais complexos.
Foco nas Relações dos Modelos: Ao olhar como diferentes modelos se comparam entre si, em vez de apenas seu desempenho absoluto, a abordagem aborda melhor os desafios únicos da publicidade online.
Principais Descobertas dos Experimentos
Experimentos foram realizados usando vários conjuntos de dados pra testar a eficácia da estrutura da Classificação de Confiança. Esses conjuntos incluíram dados industriais em larga escala, além de conjuntos de dados publicamente disponíveis. Os resultados mostraram consistentemente que o método da Classificação de Confiança superou abordagens tradicionais, como perda de cross-entropy e destilação de conhecimento.
Aumento da Precisão: Em vários testes, a estrutura demonstrou melhorias significativas nas pontuações AUC (Área Sob a Curva) em comparação com os modelos existentes. Isso significa que ela foi melhor em distinguir entre anúncios relevantes e irrelevantes pros usuários.
Aplicação no Mundo Real: A estrutura da Classificação de Confiança foi implementada com sucesso em um sistema publicitário real, resultando em métricas de CTR melhoradas durante os testes ao vivo. Ao longo de vários dias, a nova abordagem levou a um aumento mensurável nas taxas de cliques.
Visualizando o Desempenho
Pra entender melhor o impacto da abordagem da Classificação de Confiança, os pesquisadores examinaram como as previsões variaram ao longo do tempo. Eles descobriram que o método foi eficaz em aumentar as chances de engajamento positivo dos usuários, enquanto diminuía a probabilidade de interações negativas. Esse desempenho melhorado foi atribuído à capacidade da estrutura de se ajustar a alterações no cenário de dados.
Resultados de Testes A/B Online
Uma validação adicional da abordagem foi conduzida através de testes A/B, onde grupos de usuários foram expostos tanto ao modelo atual quanto ao modelo usando a estrutura da Classificação de Confiança. Os resultados mostraram uma melhoria média de 1,75% na CTR pro grupo que usou o novo método. Isso demonstra a eficácia da estrutura em configurações do mundo real e seu potencial pra impulsionar melhores resultados publicitários.
Conclusão
A estrutura da Classificação de Confiança oferece um novo método promissor pra melhorar a previsão de CTR na publicidade online. Ao focar no desempenho relativo dos modelos e aproveitar previsões passadas, ela enfrenta alguns dos principais desafios em ambientes de dados dinâmicos. A combinação de insights teóricos e evidências empíricas mostra seu potencial pra entregar resultados publicitários melhores, proporcionando um avanço no campo do aprendizado de máquina aplicado a aplicações da vida real.
Conforme as empresas continuam a se adaptar a comportamentos e preferências de usuários que mudam rapidamente, abordagens como a Classificação de Confiança podem se tornar críticas pra manter vantagens competitivas na publicidade online.
Título: Confidence Ranking for CTR Prediction
Resumo: Model evolution and constant availability of data are two common phenomena in large-scale real-world machine learning applications, e.g. ads and recommendation systems. To adapt, the real-world system typically retrain with all available data and online learn with recently available data to update the models periodically with the goal of better serving performance. In this paper, we propose a novel framework, named Confidence Ranking, which designs the optimization objective as a ranking function with two different models. Our confidence ranking loss allows direct optimization of the logits output for different convex surrogate functions of metrics, e.g. AUC and Accuracy depending on the target task and dataset. Armed with our proposed methods, our experiments show that the introduction of confidence ranking loss can outperform all baselines on the CTR prediction tasks of public and industrial datasets. This framework has been deployed in the advertisement system of JD.com to serve the main traffic in the fine-rank stage.
Autores: Jian Zhu, Congcong Liu, Pei Wang, Xiwei Zhao, Zhangang Lin, Jingping Shao
Última atualização: 2023-06-28 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2307.01206
Fonte PDF: https://arxiv.org/pdf/2307.01206
Licença: https://creativecommons.org/licenses/by-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.