Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Recupero delle informazioni# Intelligenza artificiale# Apprendimento automatico

Migliorare le previsioni del tasso di conversione durante le promozioni

Un nuovo metodo migliora le previsioni di vendita per lo shopping online.

― 6 leggere min


Aumentare le previsioniAumentare le previsionidi venditanell'e-commercepromozioni.del tasso di conversione durante leNuovi metodi rimodellano le previsioni
Indice

Nel mondo di oggi, piattaforme di shopping online come Taobao devono prevedere quanto è probabile che un utente faccia un acquisto, spesso chiamato Tasso di conversione (CVR). Prevedere correttamente il CVR è fondamentale per il successo dell'e-commerce, poiché aiuta a ottimizzare raccomandazioni e pubblicità. Tuttavia, c'è una sfida comune durante le promozioni, dove i metodi tradizionali di previsione spesso falliscono. Poiché le promozioni possono alterare significativamente il comportamento degli utenti, le aziende devono trovare modi migliori per adattare i loro modelli.

Il Problema con i Modelli Attuali

Molti modelli di previsione del CVR esistenti faticano durante gli eventi di vendita. Quando ci sono promozioni, il comportamento degli utenti cambia rapidamente. Questo porta spesso a una discrepanza tra i dati usati per addestrare il modello e i dati reali che vediamo in tempo reale. Ad esempio, durante una vendita, il numero di acquisti può fluttuare notevolmente, il che causa un calo delle prestazioni del modello. I modelli attuali spesso assumono un pattern di comportamento stabile, che si rompe durante queste promozioni.

Rivisitare i Dati Storici

Un modo efficace per affrontare questo problema è riutilizzare i dati storici delle promozioni passate. Guardando indietro a eventi di vendita simili, è possibile riconoscere dei pattern nel comportamento degli utenti che possono informare i modelli di previsione. Questo approccio consente alle aziende di fare previsioni migliori sfruttando dati passati che riflettono accuratamente il contesto promozionale.

Introduzione dell'Approccio di Riutilizzo dei Dati Storici (HDR)

Per migliorare le previsioni del CVR durante le promozioni, presentiamo un nuovo approccio chiamato Riutilizzo dei Dati Storici (HDR). Questo metodo ha tre componenti chiave.

  1. Recupero Dati Automatico: Il primo passo consiste nel trovare promozioni passate che somigliano molto a quella attuale. Il sistema recupera dati da queste promozioni simili.
  2. Correzione dello Spostamento di Distribuzione: Dopo aver ottenuto i dati storici, il secondo passo si concentra sulla correzione delle differenze tra i dati vecchi e i dati promozionali attuali per garantire una migliore corrispondenza.
  3. Modulo TransBlock: L'ultima componente è un modulo speciale che affina il modello di previsione basato sui dati storici recuperati. Questo aiuta il modello ad adattarsi più rapidamente al contesto promozionale.

Recupero Dati Automatico

Il processo di recupero dati automatico inizia rappresentando ogni giorno durante le promozioni passate come un insieme di caratteristiche. Queste caratteristiche includono vari metriche di conversione e il tasso di impressione di specifiche categorie di prodotti. Questa rappresentazione consente al sistema di cercare rapidamente promozioni passate che mostrano pattern simili a quella attuale. Trovando questi esempi passati, il sistema può informare efficacemente il modello sui comportamenti attesi.

Correzione dello Spostamento di Distribuzione

Anche quando i dati storici sono simili, possono comunque esserci differenze. Ad esempio, i tassi di conversione effettivi possono variare tra promozioni passate e quella attuale. Qui entra in gioco la correzione dello spostamento di distribuzione. Lo scopo di questo passo è regolare i dati storici per meglio adattarli alle condizioni della promozione attuale. Ripesando i dati storici, il modello può essere addestrato per tenere conto di queste discrepanze.

Modulo TransBlock

Una volta che abbiamo i dati corretti, il modulo TransBlock gioca un ruolo cruciale. Questo modulo consente un affinamento rapido del modello di previsione principale usando i dati storici. Aiuta il modello ad adattarsi evitando l'overfitting, che può verificarsi se il modello viene addestrato troppo frequentemente sugli stessi dati.

Vantaggi dell'HDR

L'approccio HDR consente notevoli miglioramenti nelle previsioni del CVR durante le promozioni di vendita. Riutilizzando i dati storici, correggendo le differenze e applicando un processo di affinamento mirato, le aziende possono ottenere una maggiore accuratezza e affidabilità nelle loro previsioni. Questo effetto positivo può portare a un miglior monetizzazione degli annunci e a una migliore esperienza complessiva per gli utenti.

Applicazioni nel Mondo Reale

L'approccio HDR è stato integrato con successo nel sistema di pubblicità display di Alibaba, specialmente durante grandi eventi promozionali come il Double 11 Sales nel 2022. In quel periodo, il sistema ha registrato aumenti notevoli in metriche chiave come il Ricavo per Mille (RPM) e il CVR. Adottando HDR, il sistema è stato in grado di fornire pubblicità meglio mirate che risuonavano con gli utenti, portando infine a più vendite.

Soluzioni Precedenti e Limitazioni

I metodi precedenti spesso si basavano sul riaddestramento diretto dei modelli sui dati storici. Tuttavia, questo approccio aveva i suoi svantaggi. Ad esempio, portava spesso a overfitting, dove il modello funzionava bene sui dati di addestramento ma faticava con nuovi dati mai visti. Inoltre, alcuni modelli cercavano di differenziare i dati promozionali e non promozionali, ma non consideravano le caratteristiche uniche di diverse promozioni, risultando in previsioni inaccurate.

Al contrario, HDR affronta efficacemente questi problemi implementando un processo più sofisticato per il riutilizzo dei dati e l'affinamento, assicurando che il modello si adatti in modo appropriato alle condizioni cambiate durante i periodi promozionali.

Il Processo di Implementazione

Per utilizzare l'approccio HDR, le aziende devono seguire un processo sistematico. Questo implica raccogliere dati degli utenti dalle promozioni precedenti, analizzarli per identificare pattern e integrare i componenti HDR nel modello di previsione del CVR esistente. Aggiornamenti e valutazioni regolari del modello sono essenziali per mantenere le prestazioni e adattarsi a nuove strategie promozionali.

Conclusione

In sintesi, prevedere i tassi di conversione durante le promozioni di vendita è una sfida complessa che molti rivenditori online affrontano. L'approccio HDR offre una soluzione riutilizzando dati storici, correggendo gli spostamenti di distribuzione e affinando i modelli di previsione in modo efficace. Come visto in implementazioni come il sistema pubblicitario di Alibaba, questo metodo può portare a notevoli miglioramenti nelle metriche aziendali e nell'engagement dei clienti.

Man mano che il panorama dell'e-commerce continua a evolversi, il perfezionamento e l'esplorazione delle tecniche di riutilizzo dei dati saranno vitali. Il potenziale dell'HDR di adattarsi a vari scenari oltre le promozioni di vendita apre porte a ulteriori progressi in futuro.

Direzioni Future

Guardando avanti, è chiaro che ci sono molte altre opportunità da esplorare nel campo del riutilizzo dei dati. Variazioni nei tassi di conversione tra diversi giorni della settimana o mesi possono fornire informazioni interessanti che l'HDR potrebbe potenzialmente sfruttare. Inoltre, l'esplorazione di altre fonti di dati al di fuori dei registri storici potrebbe offrire ulteriori spunti, migliorando l'efficacia complessiva dei modelli di previsione del CVR.

Sviluppare un approccio completo incentrato sui dati potrebbe migliorare significativamente l'accuratezza delle previsioni, beneficiando sia le aziende che i consumatori a lungo termine. Lavorando su metodi di affinamento e implementando migliori strategie di recupero dati, HDR e approcci simili possono evolvere per soddisfare le richieste in continua evoluzione degli ambienti di shopping online.

Fonte originale

Titolo: Capturing Conversion Rate Fluctuation during Sales Promotions: A Novel Historical Data Reuse Approach

Estratto: Conversion rate (CVR) prediction is one of the core components in online recommender systems, and various approaches have been proposed to obtain accurate and well-calibrated CVR estimation. However, we observe that a well-trained CVR prediction model often performs sub-optimally during sales promotions. This can be largely ascribed to the problem of the data distribution shift, in which the conventional methods no longer work. To this end, we seek to develop alternative modeling techniques for CVR prediction. Observing similar purchase patterns across different promotions, we propose reusing the historical promotion data to capture the promotional conversion patterns. Herein, we propose a novel \textbf{H}istorical \textbf{D}ata \textbf{R}euse (\textbf{HDR}) approach that first retrieves historically similar promotion data and then fine-tunes the CVR prediction model with the acquired data for better adaptation to the promotion mode. HDR consists of three components: an automated data retrieval module that seeks similar data from historical promotions, a distribution shift correction module that re-weights the retrieved data for better aligning with the target promotion, and a TransBlock module that quickly fine-tunes the original model for better adaptation to the promotion mode. Experiments conducted with real-world data demonstrate the effectiveness of HDR, as it improves both ranking and calibration metrics to a large extent. HDR has also been deployed on the display advertising system in Alibaba, bringing a lift of $9\%$ RPM and $16\%$ CVR during Double 11 Sales in 2022.

Autori: Zhangming Chan, Yu Zhang, Shuguang Han, Yong Bai, Xiang-Rong Sheng, Siyuan Lou, Jiacen Hu, Baolin Liu, Yuning Jiang, Jian Xu, Bo Zheng

Ultimo aggiornamento: 2023-06-26 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2305.12837

Fonte PDF: https://arxiv.org/pdf/2305.12837

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili