Migliorare la previsione del tasso di clic con Rec4Ad
Un nuovo framework migliora la previsione del CTR affrontando il bias di selezione dei campioni.
― 6 leggere min
Indice
La previsione del Click-Through Rate (CTR) è fondamentale nel mondo della pubblicità online. Le aziende vogliono sapere quanto è probabile che un utente clicchi su un annuncio. Questa conoscenza aiuta a mirare meglio le pubblicità e massimizzare i profitti. Un modo comune per prevedere il CTR è usare i dati delle impressioni degli annunci, ovvero le volte in cui gli annunci vengono mostrati agli utenti. Tuttavia, il modo in cui gli annunci vengono mostrati può portare a dei problemi.
Il Problema del Campionamento Selettivo
Uno dei principali problemi nella previsione del CTR è il campionamento selettivo (SSB). Questo succede quando i dati usati per addestrare un modello non rappresentano l'intera popolazione. Nella pubblicità, non tutti gli annunci hanno la stessa possibilità di essere mostrati. Alcuni annunci vengono scelti deliberatamente in base a determinati criteri, il che significa che i dati raccolti potrebbero non riflettere come si comporterebbero tutti gli annunci se mostrati in modo equo.
Questo bias può danneggiare le prestazioni del modello perché potrebbe non apprendere la vera relazione tra annunci e comportamento degli utenti. I metodi tradizionali per affrontare l'SSB spesso coinvolgono tecniche complesse che possono portare a imprecisioni e incoerenze nelle previsioni.
Perché le Soluzioni Attuali Non Sono Abbastanza
Le attuali strategie per combattere l'SSB generalmente comportano il ri-pesaggio dei campioni o l'uso di dati uniformi. Il ri-pesaggio cerca di aggiustare l'importanza dei campioni in modo che il modello apprenda in modo più equo. Tuttavia, questo metodo può portare a un'alta varianza, rendendolo inaffidabile. D'altra parte, raccogliere dati uniformi tramite campionamento casuale può compromettere l'esperienza dell'utente e portare a perdite di fatturato visto che gli utenti potrebbero vedere meno annunci.
Invece di fare affidamento su questi metodi costosi, è importante trovare una soluzione che affronti l'SSB in modo efficace senza danneggiare il business.
Sfruttare le Raccomandazioni per Migliorare la Previsione del CTR
Le tendenze recenti mostrano che molte piattaforme di e-commerce, come Taobao, mostrano sia annunci che raccomandazioni per gli utenti. Questa configurazione presenta un'opportunità. Le raccomandazioni sono gli elementi suggeriti agli utenti in base ai loro interessi. Questi due gruppi di elementi vengono selezionati usando meccanismi diversi, il che riduce al minimo la sovrapposizione nei fattori che possono influenzare le previsioni. Questa differenza può essere usata per migliorare le previsioni pubblicitarie.
Utilizzando i campioni delle raccomandazioni insieme ai campioni degli annunci, possiamo creare un sistema che aiuta a mitigare l'SSB. Questo approccio implica trasformare i campioni delle raccomandazioni in una forma utilizzabile per la previsione degli annunci, permettendo un'apprendimento migliore e risultati migliorati.
Il Framework Rec4Ad
Per sfruttare questa opportunità, è stato introdotto un nuovo framework chiamato Rec4Ad. L'obiettivo di Rec4Ad è migliorare la previsione del CTR senza fare affidamento su dati uniformi. Combina i campioni degli annunci e i campioni delle raccomandazioni per creare dati più rappresentativi per l'addestramento.
Rec4Ad funziona in due fasi principali: prima recupera e elabora i campioni delle raccomandazioni per assicurarsi che siano strettamente correlati agli annunci previsti. Poi, adotta un meccanismo per separare le influenze specifiche che potrebbero distorcere le previsioni.
Aumento dei Dati
Nella prima fase, Rec4Ad recupera i campioni delle raccomandazioni che possono informare le previsioni sugli annunci. L'obiettivo è mantenere intatta l'esperienza dell'utente mentre si garantisce che i campioni raccolti migliorino l'accuratezza del modello. Il framework si concentra solo sulla raccolta di quelli campioni di raccomandazione che si abbinano bene agli annunci di interesse, garantendo rilevanza.
Apprendimento delle Rappresentazioni Disentangled
La seconda fase del processo comporta la creazione di rappresentazioni diverse dei dati, che aiutano a separare i fattori che influenzano i clic. Questa separazione si concentra sull'identificazione del vero interesse dell'utente negli annunci, a differenza dei fattori confondenti che possono derivare dalle differenze nei meccanismi di selezione degli annunci e delle raccomandazioni.
Per raggiungere questo obiettivo, Rec4Ad utilizza due processi chiave: allineamento e decorrelazione. Questi processi aiutano a garantire che il modello apprenda i veri interessi degli utenti riducendo il rumore dei bias nei dati.
Allineamento: Questo processo garantisce che le rappresentazioni dei campioni degli annunci e delle raccomandazioni siano allineate, cioè riflettano accuratamente gli stessi interessi degli utenti. Lo fa addestrando un modello per identificare le somiglianze tra i due tipi di campioni.
Decorelazione: In questo passaggio, il modello lavora per separare le influenze specifiche dai campioni, assicurando che le previsioni fatte non riflettano alcun bias. Questo si concentra nel minimizzare la sovrapposizione tra i fattori che influenzano i clic sugli annunci rispetto a quelli che influenzano i clic sulle raccomandazioni.
Setup Sperimentale
Per testare l'efficacia di Rec4Ad, sono stati condotti esperimenti utilizzando dati dei sistemi pubblicitari e di raccomandazione di Taobao per un periodo di due settimane. L'obiettivo era verificare se l'inclusione dei campioni delle raccomandazioni avrebbe portato a un miglioramento delle prestazioni del modello nella previsione del CTR.
Sono stati testati anche vari metodi di riferimento per confrontare le prestazioni. Questi includevano metodi tradizionali che non tengono conto dell'SSB e quelli che cercano di aggiustare questo bias. Esaminando questi metodi, è stato possibile valutare i vantaggi dell'utilizzo di Rec4Ad.
Risultati degli Esperimenti
I risultati degli esperimenti hanno mostrato che Rec4Ad ha superato significativamente i modelli di riferimento. In particolare, ha ottenuto punteggi più alti in indicatori chiave di prestazione che sono importanti per gli inserzionisti, come i tassi di clic e le metriche di fatturato.
Le prestazioni sono state particolarmente evidenti in situazioni in cui gli annunci avevano bassa visibilità o meno impressioni. In questi casi, Rec4Ad ha mostrato miglioramenti notevoli, dimostrando la sua efficacia nell'affrontare il Bias di Selezione del Campione.
Inoltre, Rec4Ad ha mantenuto una buona calibrazione del modello, il che significa che le previsioni generate erano non solo accurate ma anche affidabili. Questo è importante per gli inserzionisti perché significa che possono fidarsi delle previsioni fatte dal modello.
Conclusione
Rec4Ad rappresenta una soluzione promettente alle sfide poste dal bias di selezione del campione nella previsione del CTR degli annunci. Sfruttando i campioni delle raccomandazioni, crea una rappresentazione più bilanciata degli interessi degli utenti, portando a previsioni migliori e a risultati aziendali migliorati.
Con l'evoluzione della pubblicità online, framework come Rec4Ad possono aiutare le aziende a prendere decisioni informate basate su dati affidabili, massimizzando i loro sforzi pubblicitari mentre forniscono esperienze preziose agli utenti.
Titolo: Rec4Ad: A Free Lunch to Mitigate Sample Selection Bias for Ads CTR Prediction in Taobao
Estratto: Click-Through Rate (CTR) prediction serves as a fundamental component in online advertising. A common practice is to train a CTR model on advertisement (ad) impressions with user feedback. Since ad impressions are purposely selected by the model itself, their distribution differs from the inference distribution and thus exhibits sample selection bias (SSB) that affects model performance. Existing studies on SSB mainly employ sample re-weighting techniques which suffer from high variance and poor model calibration. Another line of work relies on costly uniform data that is inadequate to train industrial models. Thus mitigating SSB in industrial models with a uniform-data-free framework is worth exploring. Fortunately, many platforms display mixed results of organic items (i.e., recommendations) and sponsored items (i.e., ads) to users, where impressions of ads and recommendations are selected by different systems but share the same user decision rationales. Based on the above characteristics, we propose to leverage recommendations samples as a free lunch to mitigate SSB for ads CTR model (Rec4Ad). After elaborating data augmentation, Rec4Ad learns disentangled representations with alignment and decorrelation modules for enhancement. When deployed in Taobao display advertising system, Rec4Ad achieves substantial gains in key business metrics, with a lift of up to +6.6\% CTR and +2.9\% RPM.
Autori: Jingyue Gao, Shuguang Han, Han Zhu, Siran Yang, Yuning Jiang, Jian Xu, Bo Zheng
Ultimo aggiornamento: 2023-06-06 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2306.03527
Fonte PDF: https://arxiv.org/pdf/2306.03527
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.