Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Recupero delle informazioni

Avanzare le raccomandazioni con il framework MBGen

Un nuovo modo per migliorare le raccomandazioni multi-comportamentali.

― 7 leggere min


MBGen: Trasformare iMBGen: Trasformare iConsiglicomportamenti degli utenti.precisione delle previsioni suiIl nuovo framework migliora la
Indice

La raccomandazione sequenziale multi-comportamentale si concentra su come prevedere cosa farà un utente dopo, considerando diversi tipi di comportamenti, come cliccare, acquistare o aggiungere articoli a un carrello. I metodi tradizionali spesso si concentrano solo sul prevedere il prossimo articolo senza tenere conto del tipo di comportamento coinvolto, il che può portare a opportunità mancate per raccomandazioni migliori.

In questa discussione, presentiamo un nuovo approccio chiamato MBGen, che punta a migliorare il modo in cui facciamo raccomandazioni incorporando sia il tipo di comportamento che un utente potrebbe avere, sia gli articoli che potrebbero interessargli dopo. Il processo prevede due fasi principali: prima si prevede il tipo di comportamento, e poi si prevede quale articolo segue in base a quel comportamento.

Panoramica del Problema

Il problema qui è come combinare efficacemente vari comportamenti degli utenti per migliorare le raccomandazioni. I metodi precedenti avevano certe limitazioni. O dividevano i comportamenti in gruppi per un'elaborazione separata, oppure modellavano direttamente l'intera sequenza di comportamenti senza integrarli efficacemente. Tuttavia, questi approcci spesso trascuravano la relazione tra i tipi di comportamento e gli articoli consigliati, riducendo la potenza predittiva complessiva dei modelli.

Riconoscendo l'importanza delle intenzioni degli utenti dietro diverse azioni, il nostro approccio scompone il processo di raccomandazione in due fasi chiare. La prima fase identifica il prossimo tipo di comportamento basato sulle azioni passate, e la seconda fase prevede il prossimo articolo tenendo conto di questo tipo di comportamento previsto.

Perché Prevedere il Comportamento è Importante

Capire il tipo di comportamento che un utente è probabile che prenda può migliorare significativamente l'accuratezza delle raccomandazioni. Ad esempio, se un utente aggiunge un articolo al carrello, potrebbe andare direttamente al checkout o cercare articoli correlati da acquistare. Riconoscerlo può guidare la piattaforma a presentare le proposte più rilevanti.

Inoltre, fare previsioni sui tipi di comportamento apre nuove opportunità per migliorare l'esperienza dell'utente. Se il sistema sa che un utente è probabile che controlli presto, può indirizzarlo alla pagina di checkout o suggerire articoli complementari che potrebbero aumentare il totale degli acquisti.

Un Nuovo Quadro: MBGen

Per affrontare le limitazioni dei metodi precedenti, MBGen introduce un quadro innovativo che opera in due fasi distinte. Inizia con l'identificazione del prossimo comportamento, seguita dalla previsione del prossimo articolo basato sia sul comportamento previsto che sulle interazioni precedenti. Questo approccio in due fasi assicura che le raccomandazioni siano più allineate con le intenzioni degli utenti.

Processo in Due Fasi

  1. Prevedere il Tipo di Comportamento: Dato un insieme di interazioni passate, il modello determina prima che tipo di comportamento l'utente è probabile che svolga.
  2. Prevedere il Prossimo Articolo: Una volta stabilito il tipo di comportamento, il modello prevede quale articolo l'utente potrebbe interagire successivamente.

Questa chiara separazione tra prevedere il comportamento e gli articoli consente un approccio più strutturato nel fare raccomandazioni.

Affrontare le Sfide

Ci sono diverse sfide che vengono con questo modello duale.

  • Variabilità negli Spazi di Soluzione: Il numero di comportamenti possibili è generalmente ridotto, mentre il numero di articoli può essere enorme. Questa differenza di scala può portare a problemi durante il processo di apprendimento.

  • Complessità del Modello: Molti attuali modelli di raccomandazione non sono attrezzati per gestire questa complessità, spesso concentrandosi su strutture più semplici che potrebbero non catturare adeguatamente i modelli presenti nelle sequenze di comportamento e articolo combinati.

Strategia di Tokenizzazione

MBGen utilizza un metodo speciale chiamato tokenizzazione per combinare diversi aspetti del comportamento degli utenti e delle interazioni con gli articoli in un formato unico. Ogni articolo e comportamento è scomposto in token, consentendo al modello di trattare questi token come parte di una sequenza più ampia. Questa intercalazione di token aiuta a catturare le relazioni tra di loro in modo più efficace.

Meccanismo di Attenzione

Un meccanismo di attenzione è utilizzato all'interno di questo quadro, il che consente al modello di concentrarsi su parti specifiche dei dati di input quando fa previsioni. Questo aiuta a riconoscere modelli dettagliati tra i tipi di comportamenti e gli articoli.

Test Estesi

Per convalidare l'efficacia di MBGen, sono stati condotti esperimenti estesi utilizzando set di dati pubblicamente disponibili. I risultati hanno rivelato che MBGen ha superato i modelli esistenti, ottenendo miglioramenti che vanno dal 30% al 70% in vari compiti di raccomandazione.

Confronto con Modelli Esistenti

I metodi storici nell'area delle raccomandazioni multi-comportamentali usano spesso aggregazione a due fasi o modellano l'intera sequenza di input insieme senza integrazione tra i tipi di comportamento e le previsioni degli articoli. MBGen si distingue trattando la previsione dei tipi di comportamento come una parte fondamentale del processo di raccomandazione.

Principali Contributi

  • Quattro Strutturato: Inquadrando il compito come un processo sequenziale in due fasi, MBGen è in grado di incorporare i tipi di comportamento nel quadro di apprendimento in modo efficace.
  • Modello Unificato: MBGen introduce un modello di raccomandazione generativo che opera su un obiettivo di previsione del prossimo token unificato, migliorando così la sinergia tra la previsione del comportamento e degli articoli.
  • Robustezza Attraverso i Dati: Il modello è stato testato su diversi set di dati, dimostrando la sua capacità di adattarsi e performare costantemente bene.

Lavori Correlati

Le ricerche precedenti nelle raccomandazioni sequenziali si sono principalmente concentrate sulle interazioni unidimensionali utente-articolo. Spesso dipendevano da varie architetture, come le reti neurali ricorrenti o i trasformatori, ma non riuscivano a includere efficacemente il tipo di interazione in corso. Gli sforzi recenti hanno tentato di integrare più esplicitamente i tipi di comportamento, ma rimangono sfide nell'utilizzare efficacemente queste informazioni per migliorare le previsioni.

Dinamiche della Raccomandazione Sequenziale

I sistemi tradizionali di raccomandazione sequenziale mirano a prevedere il prossimo articolo sulla base delle interazioni storiche. Vari modelli, dalle catene di Markov alle tecniche di deep learning, sono stati impiegati per raggiungere questo obiettivo. Tuttavia, spesso mancano della capacità di tenere conto dei tipi di interazioni, il che può portare a previsioni subottimali.

Approcci di Raccomandazione Generativa

I sistemi di raccomandazione generativa hanno mostrato promesse nel fornire prestazioni migliori impiegando tecniche innovative per la rappresentazione degli articoli. Questi sistemi tokenizzano gli articoli, consentendo al modello di concentrarsi su aspetti discreti degli articoli. Tuttavia, molti di questi approcci non incorporano dati comportamentali, limitando la loro efficacia complessiva.

Architettura di MBGen

L'architettura di MBGen coinvolge diversi elementi chiave che lavorano insieme per fornire raccomandazioni accurate.

Modellazione a Livello di Token

Il quadro è costruito su un approccio basato su token, dove sia i comportamenti che le interazioni con gli articoli sono rappresentati come token intercambiabili. Questo design consente al modello di ottenere una comprensione fine delle interazioni degli utenti.

Architettura Sparsa a Routing Posizionale

Per scalare il modello in modo efficiente, MBGen impiega un'architettura sparsa a routing posizionale. Ogni token della sequenza di interazione è elaborato attraverso reti esperte dedicate, il che migliora le prestazioni complessive del modello gestendo al contempo l'efficienza computazionale.

Metriche di Valutazione

Le prestazioni di MBGen sono state valutate utilizzando metriche standard come Recall@K e NDCG@K. Queste metriche sono cruciali per determinare quanto bene il modello prevede le interazioni degli utenti, specialmente in un ambiente di vendita al dettaglio online.

Conclusioni

L'introduzione di MBGen segna un passo significativo avanti nei sistemi di raccomandazione sequenziale multi-comportamentale. Sottolineando l'importanza di prevedere sia i tipi di comportamento degli utenti che gli articoli, offre un approccio più accurato e orientato all'utente alle raccomandazioni.

Il lavoro futuro si concentrerà su come continuare a perfezionare questo quadro e esplorare metodi di campionamento più avanzati per capacità di previsione ancora migliori. I risultati finora dimostrano il potenziale per miglioramenti trasformativi nel modo in cui vengono generate e consegnate le raccomandazioni in varie applicazioni.

Fonte originale

Titolo: Multi-Behavior Generative Recommendation

Estratto: Multi-behavior sequential recommendation (MBSR) aims to incorporate behavior types of interactions for better recommendations. Existing approaches focus on the next-item prediction objective, neglecting the value of integrating the target behavior type into the learning objective. In this paper, we propose MBGen, a novel Multi-Behavior sequential Generative recommendation framework. We formulate the MBSR task into a consecutive two-step process: (1) given item sequences, MBGen first predicts the next behavior type to frame the user intention, (2) given item sequences and a target behavior type, MBGen then predicts the next items. To model such a two-step process, we tokenize both behaviors and items into tokens and construct one single token sequence with both behaviors and items placed interleaved. Furthermore, MBGen learns to autoregressively generate the next behavior and item tokens in a unified generative recommendation paradigm, naturally enabling a multi-task capability. Additionally, we exploit the heterogeneous nature of token sequences in the generative recommendation and propose a position-routed sparse architecture to efficiently and effectively scale up models. Extensive experiments on public datasets demonstrate that MBGen significantly outperforms existing MBSR models across multiple tasks.

Autori: Zihan Liu, Yupeng Hou, Julian McAuley

Ultimo aggiornamento: 2024-07-29 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2405.16871

Fonte PDF: https://arxiv.org/pdf/2405.16871

Licenza: https://creativecommons.org/licenses/by-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili