M2GNN: Un Nuovo Approccio alle Raccomandazioni Cross-Domain
M2GNN affronta la scarsità di dati nelle raccomandazioni usando bene i tag.
― 5 leggere min
Indice
La raccomandazione cross-domain aiuta a risolvere il problema quando non ci sono dati sufficienti su utenti o articoli in un'area specifica. Un approccio efficace è usare le informazioni testuali. Però, ci sono ancora due principali sfide. Prima di tutto, molti sistemi non hanno descrizioni dettagliate per gli articoli e si affidano soprattutto a etichette o tag brevi. In secondo luogo, non tutti gli interessi di diverse aree sono utili per fare raccomandazioni in un'area target. Alcuni interessi potrebbero addirittura confondere le raccomandazioni.
La Soluzione Proposta
Per affrontare questi problemi, è stata introdotta una nuova metodologia chiamata M2GNN, che sta per Metapath and Multi-interest Aggregated Graph Neural Network. Questo sistema usa tag per creare connessioni tra utenti, articoli e tag in diversi domini.
Costruire una Rete di Connessione
Il metodo costruisce una rete che cattura come gli utenti interagiscono con gli articoli e come i tag si relazionano sia con gli utenti che con gli articoli. Ogni dominio ha i suoi percorsi specifici che rappresentano come tag e utenti sono connessi. Questo aiuta a capire meglio le preferenze degli utenti.
Apprendere le Rappresentazioni degli Utenti
M2GNN apprende le preferenze degli utenti filtrando i tag meno importanti e concentrandosi su quelli più rilevanti. Questo avviene in due fasi. La prima fase si concentra sui tag all'interno dello stesso dominio, mentre la seconda fase guarda a come queste preferenze possono essere applicate in diversi domini.
Sfide in Dianping
Dianping è un servizio online in Cina dove gli utenti cercano servizi locali e scrivono recensioni. Molti utenti sono nuovi o non hanno interagito molto, creando un problema di scarsità di dati. Per affrontare questo, il metodo M2GNN usa tag che sono più facili da raccogliere e analizzare rispetto alle descrizioni dettagliate.
Importanza dei Tag
I tag sono parole chiave che descrivono servizi o azioni. Ad esempio, se un utente cerca un tipo specifico di cibo, i tag associati aiuteranno a suggerire recensioni relative a quella ricerca. Il metodo conta come i tag sono legati tra diverse attività, permettendo raccomandazioni più efficaci.
Analisi dei Tag
Il metodo conduce un'analisi per vedere come diversi tag sono utili per raccomandare articoli. Esamina quali tag collegati a ricerche e consumi portano a raccomandazioni positive nel dominio delle recensioni.
Comportamento degli Utenti
Capire il comportamento degli utenti aiuta a determinare come gli interessi possono essere condivisi e modificati tra diversi domini. Storicamente, molti metodi si sono concentrati su come gli interessi degli utenti si trasferivano da un'area all'altra senza considerare il contenuto stesso. M2GNN si distingue perché combina il comportamento degli utenti con la comprensione del contenuto.
Il Framework di M2GNN
Il framework di M2GNN è costruito per gestire le complesse relazioni tra tag, utenti e servizi.
Creare un Grafo Basato sui Tag
Un tipo speciale di grafo è formato usando i tag per rappresentare le relazioni tra diversi domini. Ogni dominio ha i suoi tipi specifici di interazioni, e il grafo aiuta a visualizzare queste connessioni.
Importanza dell'Aggregazione
Per dare senso alle relazioni, M2GNN usa un processo di aggregazione in due fasi. La prima fase guarda le informazioni rilevanti all'interno dello stesso dominio, e la seconda fase analizza come queste informazioni possono essere condivise tra diversi domini.
Esperimenti e Risultati
M2GNN è stato testato in vari esperimenti per analizzarne l'efficacia rispetto a metodi precedenti.
Dataset Utilizzati
Due dataset sono stati utilizzati per i test. Il primo era un dataset industriale creato appositamente chiamato DPBJ, focalizzato sui dati di Dianping. Il secondo dataset era un dataset Amazon disponibile pubblicamente che si occupava anch'esso di recensioni.
Confronto delle Prestazioni
I risultati hanno mostrato che M2GNN ha costantemente superato i metodi esistenti in vari aspetti. Il metodo non solo ha fornito raccomandazioni migliori, ma ha anche migliorato le esperienze degli utenti che avevano interazioni limitate.
Impatto sugli Utenti Cold-start
Una scoperta significativa è stata come M2GNN ha aiutato gli utenti cold-start. Molti sistemi di raccomandazione fanno fatica con utenti che non hanno attività precedenti. M2GNN ha dimostrato di poter assistere con successo questi utenti sfruttando dati di altri domini.
Test Online
Un test online è stato condotto in un periodo di due settimane usando M2GNN all'interno dell'app Dianping. L'obiettivo era confrontare la sua efficacia con i sistemi esistenti.
Metriche per la Valutazione
Tre metriche chiave sono state utilizzate per valutare le prestazioni: numero totale di recensioni raccolte, recensioni raccolte per utente e il tasso complessivo di raccolta.
Risultati Positivi
I risultati hanno indicato miglioramenti sostanziali in tutte e tre le metriche, specialmente per utenti inattivi e cold-start. Questo ha evidenziato la capacità di M2GNN di affrontare efficacemente il problema della scarsità di dati.
Comprendere le Preferenze degli Utenti
M2GNN ha anche offerto spunti sulle preferenze degli utenti attraverso il suo approccio basato sui tag. Visualizzando come gli interessi si formano da diversi tag, il metodo ha fornito maggiore chiarezza sul comportamento degli utenti. Questo aiuta a creare un'esperienza di raccomandazione più personalizzata per gli utenti.
Raggruppamento dei Tag
Il sistema può raggruppare i tag in base ai loro significati, portando a una migliore comprensione degli interessi degli utenti. Ad esempio, alcuni tag legati a cucine specifiche hanno mostrato un modello nelle preferenze degli utenti, indicando quali tipi di recensioni potrebbero trovare utili.
Lavoro Futuro
I ricercatori pianificano di migliorare ulteriormente M2GNN affinando il filtro per i tag non utili. Trovare metodi migliori per campionare nodi in GNN sarà un'area di focus, mirata a raffinare come i dati vengono elaborati e migliorare le raccomandazioni.
Conclusione
M2GNN è un progresso promettente nel campo delle raccomandazioni cross-domain, in particolare in ambienti dove i dati sono scarsi. Utilizzando i tag in modo efficace, migliora la comprensione degli interessi e del comportamento degli utenti, portando a sistemi di raccomandazione molto migliori. Il successo di questo metodo mostra il potenziale di integrare informazioni di contenuto con il comportamento degli utenti in un modo che giova sia agli utenti che ai fornitori di servizi.
Titolo: M2GNN: Metapath and Multi-interest Aggregated Graph Neural Network for Tag-based Cross-domain Recommendation
Estratto: Cross-domain recommendation (CDR) is an effective way to alleviate the data sparsity problem. Content-based CDR is one of the most promising branches since most kinds of products can be described by a piece of text, especially when cold-start users or items have few interactions. However, two vital issues are still under-explored: (1) From the content modeling perspective, sufficient long-text descriptions are usually scarce in a real recommender system, more often the light-weight textual features, such as a few keywords or tags, are more accessible, which is improperly modeled by existing methods. (2) From the CDR perspective, not all inter-domain interests are helpful to infer intra-domain interests. Caused by domain-specific features, there are part of signals benefiting for recommendation in the source domain but harmful for that in the target domain. Therefore, how to distill useful interests is crucial. To tackle the above two problems, we propose a metapath and multi-interest aggregated graph neural network (M2GNN). Specifically, to model the tag-based contents, we construct a heterogeneous information network to hold the semantic relatedness between users, items, and tags in all domains. The metapath schema is predefined according to domain-specific knowledge, with one metapath for one domain. User representations are learned by GNN with a hierarchical aggregation framework, where the intra-metapath aggregation firstly filters out trivial tags and the inter-metapath aggregation further filters out useless interests. Offline experiments and online A/B tests demonstrate that M2GNN achieves significant improvements over the state-of-the-art methods and current industrial recommender system in Dianping, respectively. Further analysis shows that M2GNN offers an interpretable recommendation.
Autori: Zepeng Huai, Yuji Yang, Mengdi Zhang, Zhongyi Zhang, Yichun Li, Wei Wu
Ultimo aggiornamento: 2023-04-16 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2304.07911
Fonte PDF: https://arxiv.org/pdf/2304.07911
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.