Avanzare le raccomandazioni con il framework MBGen
Un nuovo modo per migliorare le raccomandazioni multi-comportamentali.
― 7 leggere min
Indice
- Panoramica del Problema
- Perché Prevedere il Comportamento è Importante
- Un Nuovo Quadro: MBGen
- Test Estesi
- Confronto con Modelli Esistenti
- Lavori Correlati
- Dinamiche della Raccomandazione Sequenziale
- Approcci di Raccomandazione Generativa
- Architettura di MBGen
- Metriche di Valutazione
- Conclusioni
- Fonte originale
- Link di riferimento
La raccomandazione sequenziale multi-comportamentale si concentra su come prevedere cosa farà un utente dopo, considerando diversi tipi di comportamenti, come cliccare, acquistare o aggiungere articoli a un carrello. I metodi tradizionali spesso si concentrano solo sul prevedere il prossimo articolo senza tenere conto del tipo di comportamento coinvolto, il che può portare a opportunità mancate per raccomandazioni migliori.
In questa discussione, presentiamo un nuovo approccio chiamato MBGen, che punta a migliorare il modo in cui facciamo raccomandazioni incorporando sia il tipo di comportamento che un utente potrebbe avere, sia gli articoli che potrebbero interessargli dopo. Il processo prevede due fasi principali: prima si prevede il tipo di comportamento, e poi si prevede quale articolo segue in base a quel comportamento.
Panoramica del Problema
Il problema qui è come combinare efficacemente vari comportamenti degli utenti per migliorare le raccomandazioni. I metodi precedenti avevano certe limitazioni. O dividevano i comportamenti in gruppi per un'elaborazione separata, oppure modellavano direttamente l'intera sequenza di comportamenti senza integrarli efficacemente. Tuttavia, questi approcci spesso trascuravano la relazione tra i tipi di comportamento e gli articoli consigliati, riducendo la potenza predittiva complessiva dei modelli.
Riconoscendo l'importanza delle intenzioni degli utenti dietro diverse azioni, il nostro approccio scompone il processo di raccomandazione in due fasi chiare. La prima fase identifica il prossimo tipo di comportamento basato sulle azioni passate, e la seconda fase prevede il prossimo articolo tenendo conto di questo tipo di comportamento previsto.
Perché Prevedere il Comportamento è Importante
Capire il tipo di comportamento che un utente è probabile che prenda può migliorare significativamente l'accuratezza delle raccomandazioni. Ad esempio, se un utente aggiunge un articolo al carrello, potrebbe andare direttamente al checkout o cercare articoli correlati da acquistare. Riconoscerlo può guidare la piattaforma a presentare le proposte più rilevanti.
Inoltre, fare previsioni sui tipi di comportamento apre nuove opportunità per migliorare l'esperienza dell'utente. Se il sistema sa che un utente è probabile che controlli presto, può indirizzarlo alla pagina di checkout o suggerire articoli complementari che potrebbero aumentare il totale degli acquisti.
Un Nuovo Quadro: MBGen
Per affrontare le limitazioni dei metodi precedenti, MBGen introduce un quadro innovativo che opera in due fasi distinte. Inizia con l'identificazione del prossimo comportamento, seguita dalla previsione del prossimo articolo basato sia sul comportamento previsto che sulle interazioni precedenti. Questo approccio in due fasi assicura che le raccomandazioni siano più allineate con le intenzioni degli utenti.
Processo in Due Fasi
- Prevedere il Tipo di Comportamento: Dato un insieme di interazioni passate, il modello determina prima che tipo di comportamento l'utente è probabile che svolga.
- Prevedere il Prossimo Articolo: Una volta stabilito il tipo di comportamento, il modello prevede quale articolo l'utente potrebbe interagire successivamente.
Questa chiara separazione tra prevedere il comportamento e gli articoli consente un approccio più strutturato nel fare raccomandazioni.
Affrontare le Sfide
Ci sono diverse sfide che vengono con questo modello duale.
Variabilità negli Spazi di Soluzione: Il numero di comportamenti possibili è generalmente ridotto, mentre il numero di articoli può essere enorme. Questa differenza di scala può portare a problemi durante il processo di apprendimento.
Complessità del Modello: Molti attuali modelli di raccomandazione non sono attrezzati per gestire questa complessità, spesso concentrandosi su strutture più semplici che potrebbero non catturare adeguatamente i modelli presenti nelle sequenze di comportamento e articolo combinati.
Strategia di Tokenizzazione
MBGen utilizza un metodo speciale chiamato tokenizzazione per combinare diversi aspetti del comportamento degli utenti e delle interazioni con gli articoli in un formato unico. Ogni articolo e comportamento è scomposto in token, consentendo al modello di trattare questi token come parte di una sequenza più ampia. Questa intercalazione di token aiuta a catturare le relazioni tra di loro in modo più efficace.
Meccanismo di Attenzione
Un meccanismo di attenzione è utilizzato all'interno di questo quadro, il che consente al modello di concentrarsi su parti specifiche dei dati di input quando fa previsioni. Questo aiuta a riconoscere modelli dettagliati tra i tipi di comportamenti e gli articoli.
Test Estesi
Per convalidare l'efficacia di MBGen, sono stati condotti esperimenti estesi utilizzando set di dati pubblicamente disponibili. I risultati hanno rivelato che MBGen ha superato i modelli esistenti, ottenendo miglioramenti che vanno dal 30% al 70% in vari compiti di raccomandazione.
Confronto con Modelli Esistenti
I metodi storici nell'area delle raccomandazioni multi-comportamentali usano spesso aggregazione a due fasi o modellano l'intera sequenza di input insieme senza integrazione tra i tipi di comportamento e le previsioni degli articoli. MBGen si distingue trattando la previsione dei tipi di comportamento come una parte fondamentale del processo di raccomandazione.
Principali Contributi
- Quattro Strutturato: Inquadrando il compito come un processo sequenziale in due fasi, MBGen è in grado di incorporare i tipi di comportamento nel quadro di apprendimento in modo efficace.
- Modello Unificato: MBGen introduce un modello di raccomandazione generativo che opera su un obiettivo di previsione del prossimo token unificato, migliorando così la sinergia tra la previsione del comportamento e degli articoli.
- Robustezza Attraverso i Dati: Il modello è stato testato su diversi set di dati, dimostrando la sua capacità di adattarsi e performare costantemente bene.
Lavori Correlati
Le ricerche precedenti nelle raccomandazioni sequenziali si sono principalmente concentrate sulle interazioni unidimensionali utente-articolo. Spesso dipendevano da varie architetture, come le reti neurali ricorrenti o i trasformatori, ma non riuscivano a includere efficacemente il tipo di interazione in corso. Gli sforzi recenti hanno tentato di integrare più esplicitamente i tipi di comportamento, ma rimangono sfide nell'utilizzare efficacemente queste informazioni per migliorare le previsioni.
Dinamiche della Raccomandazione Sequenziale
I sistemi tradizionali di raccomandazione sequenziale mirano a prevedere il prossimo articolo sulla base delle interazioni storiche. Vari modelli, dalle catene di Markov alle tecniche di deep learning, sono stati impiegati per raggiungere questo obiettivo. Tuttavia, spesso mancano della capacità di tenere conto dei tipi di interazioni, il che può portare a previsioni subottimali.
Approcci di Raccomandazione Generativa
I sistemi di raccomandazione generativa hanno mostrato promesse nel fornire prestazioni migliori impiegando tecniche innovative per la rappresentazione degli articoli. Questi sistemi tokenizzano gli articoli, consentendo al modello di concentrarsi su aspetti discreti degli articoli. Tuttavia, molti di questi approcci non incorporano dati comportamentali, limitando la loro efficacia complessiva.
Architettura di MBGen
L'architettura di MBGen coinvolge diversi elementi chiave che lavorano insieme per fornire raccomandazioni accurate.
Modellazione a Livello di Token
Il quadro è costruito su un approccio basato su token, dove sia i comportamenti che le interazioni con gli articoli sono rappresentati come token intercambiabili. Questo design consente al modello di ottenere una comprensione fine delle interazioni degli utenti.
Architettura Sparsa a Routing Posizionale
Per scalare il modello in modo efficiente, MBGen impiega un'architettura sparsa a routing posizionale. Ogni token della sequenza di interazione è elaborato attraverso reti esperte dedicate, il che migliora le prestazioni complessive del modello gestendo al contempo l'efficienza computazionale.
Metriche di Valutazione
Le prestazioni di MBGen sono state valutate utilizzando metriche standard come Recall@K e NDCG@K. Queste metriche sono cruciali per determinare quanto bene il modello prevede le interazioni degli utenti, specialmente in un ambiente di vendita al dettaglio online.
Conclusioni
L'introduzione di MBGen segna un passo significativo avanti nei sistemi di raccomandazione sequenziale multi-comportamentale. Sottolineando l'importanza di prevedere sia i tipi di comportamento degli utenti che gli articoli, offre un approccio più accurato e orientato all'utente alle raccomandazioni.
Il lavoro futuro si concentrerà su come continuare a perfezionare questo quadro e esplorare metodi di campionamento più avanzati per capacità di previsione ancora migliori. I risultati finora dimostrano il potenziale per miglioramenti trasformativi nel modo in cui vengono generate e consegnate le raccomandazioni in varie applicazioni.
Titolo: Multi-Behavior Generative Recommendation
Estratto: Multi-behavior sequential recommendation (MBSR) aims to incorporate behavior types of interactions for better recommendations. Existing approaches focus on the next-item prediction objective, neglecting the value of integrating the target behavior type into the learning objective. In this paper, we propose MBGen, a novel Multi-Behavior sequential Generative recommendation framework. We formulate the MBSR task into a consecutive two-step process: (1) given item sequences, MBGen first predicts the next behavior type to frame the user intention, (2) given item sequences and a target behavior type, MBGen then predicts the next items. To model such a two-step process, we tokenize both behaviors and items into tokens and construct one single token sequence with both behaviors and items placed interleaved. Furthermore, MBGen learns to autoregressively generate the next behavior and item tokens in a unified generative recommendation paradigm, naturally enabling a multi-task capability. Additionally, we exploit the heterogeneous nature of token sequences in the generative recommendation and propose a position-routed sparse architecture to efficiently and effectively scale up models. Extensive experiments on public datasets demonstrate that MBGen significantly outperforms existing MBSR models across multiple tasks.
Autori: Zihan Liu, Yupeng Hou, Julian McAuley
Ultimo aggiornamento: 2024-07-29 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2405.16871
Fonte PDF: https://arxiv.org/pdf/2405.16871
Licenza: https://creativecommons.org/licenses/by-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.