XWalk: Un Nuovo Metodo per la Ricerca di Prodotti
XWalk trasforma le ricerche di prodotti considerandole come raccomandazioni, migliorando l'efficacia dell'e-commerce.
― 5 leggere min
Indice
Nello shopping online, la maggior parte delle vendite arriva da ricerche popolari, conosciute come head queries. Migliorare come gestiamo queste query comuni può fare una grande differenza per le aziende di e-commerce. Molti sistemi di ricerca sono impostati su due livelli: uno che trova rapidamente un numero ridotto di prodotti potenzialmente rilevanti e un altro che li classifica in modo più accurato. Migliorando il primo livello, noto come Recupero dei candidati, possiamo aumentare l'efficacia complessiva.
Il Problema con i Metodi di Ricerca Attuali
Molti metodi di ricerca attuali funzionano meglio per le query popolari che per quelle meno comuni. Questo è principalmente dovuto alla disponibilità di dati per l'addestramento. Di solito ci sono più esempi disponibili per le query popolari, il che rende più facile per i modelli imparare e performare bene. Tuttavia, c'è ancora spazio per miglioramenti. Prendendo spunti da come vengono fatte le raccomandazioni, possiamo migliorare i metodi di ricerca per funzionare meglio per le query comuni.
Introduzione di XWalk
Presentiamo XWalk, un nuovo metodo per il recupero dei candidati nella ricerca di prodotti. Invece di vedere la ricerca come semplice corrispondenza tra query degli utenti e prodotti, XWalk guarda al problema come a un compito di raccomandazione, in cui consigliamo elenchi di prodotti basati sulle query di ricerca stesse. Questo metodo è efficiente da addestrare e usare, anche in ambienti di shopping online affollati.
XWalk sfrutta passeggiate casuali su un grafo che rappresenta le interazioni tra elenchi di prodotti e query. Questo approccio può superare i metodi di ricerca basati su reti neurali esistenti, specialmente per le query popolari. Combinando XWalk con altri metodi di recupero, possiamo creare un sistema che funziona meglio di qualsiasi metodo individuale.
Come Funziona XWalk
L'approccio tradizionale alla ricerca spesso costruisce caratteristiche da grafi ma non li usa direttamente per il recupero. XWalk cambia questo usando grafi di interazione dai Sistemi di Raccomandazione, dove utenti e prodotti sono rappresentati come nodi collegati da interazioni come acquisti o clic.
Il metodo delle passeggiate casuali aiuta a generare raccomandazioni. In XWalk, creiamo un grafo da query degli utenti ed elenchi di prodotti basati su dati storici. Questo grafo è più efficiente rispetto agli approcci tipici delle reti neurali, che possono essere complessi e lenti.
Costruzione del Grafo
Per costruire il grafo utilizzato in XWalk, iniziamo prendendo un log delle interazioni passate degli utenti con query ed elenchi di prodotti per un anno. Ogni query e prodotto unico è aggiunto come nodo, e le interazioni tra di essi creano degli spigoli. I pesi su questi spigoli rappresentano quanto bene un prodotto converte da una query in base alle azioni degli utenti come cliccare o acquistare.
Questo grafo ponderato consente raccomandazioni migliori poiché possiamo dare priorità ai prodotti in base alle loro performance per specifiche query.
Inferenza Efficiente
Una volta costruito il grafo, il recupero di elenchi rilevanti per una query di ricerca può essere fatto in modo efficiente. Invece di usare la ricerca in profondità, che può essere lenta a causa dei modelli casuali di accesso alla memoria, XWalk usa un metodo di ricerca in ampiezza. Questo rende il processo di recupero più veloce ed efficiente.
Quando un utente cerca una query, campioniamo elenchi rilevanti utilizzando una struttura che li classifica in base a quanto frequentemente sono stati raccomandati in passato.
Espansione del Grafo
La nostra piattaforma di e-commerce presenta molti venditori indipendenti, consentendo elenchi diversi. Per rendere il grafo ancora più utile, possiamo aggiungere nodi per i negozi e tag relativi ai prodotti. Questo aiuta a connettere meglio i prodotti anche quando ci sono poche interazioni storiche.
Includendo più elementi nel nostro grafo, XWalk può anche gestire nuovi prodotti che non hanno ancora ricevuto molta attenzione, risolvendo il problema quando ci sono pochi dati precedenti.
Raccolta Dati
Per i nostri esperimenti, abbiamo raccolto un anno di dati sulle Interazioni degli utenti con i prodotti. Questi dati includevano clic, articoli aggiunti ai carrelli e acquisti. Ogni query e prodotto è collegato alle vendite, il che dà al modello un quadro più chiaro di ciò che gli utenti vogliono.
Abbiamo raccolto una vasta varietà di query ed elenchi, così come interazioni degli utenti. Questa quantità di dati aiuta a garantire che XWalk sia ben addestrato per gestire molti diversi scenari di shopping.
Impostazione degli Esperimenti
Per valutare le performance di XWalk, lo abbiamo confrontato con altri due metodi di recupero. Il primo era un metodo tradizionale basato sulla corrispondenza di testo (BM25), e il secondo era un metodo più avanzato che utilizza reti neurali (NIR). Ogni metodo è stato testato per vedere quanto efficacemente trovava prodotti rilevanti per le query degli utenti.
Abbiamo misurato quanto bene ciascun metodo ha performato usando metriche relative al richiamo, che indica quanti risultati rilevanti sono stati trovati, e alla precisione media, che mostra la qualità dei risultati restituiti.
Risultati e Scoperte
XWalk ha mostrato una forte performance per le query popolari, superando significativamente gli altri metodi. Anche quando combinato con BM25, ha dimostrato una maggiore accuratezza nel recuperare prodotti rilevanti.
Anche se XWalk è meno efficace per query rare o nuove, eccelle nel segmento delle query popolari, che è importante per le vendite nell'e-commerce. BM25, d'altra parte, performa meglio con query nuove poiché si basa di più sulla somiglianza testuale piuttosto che sulle interazioni precedenti.
Test Online
XWalk è stato testato in un ambiente live su una grande piattaforma di e-commerce. L'esperimento ha mostrato che l'incorporazione di XWalk ha portato a un notevole aumento delle conversioni per le ricerche di prodotti. Inoltre, è stato notato per avere una Latenza più bassa, il che significa che i risultati venivano restituiti più velocemente rispetto ad altri sistemi.
Conclusione
XWalk presenta un nuovo modo di gestire le ricerche di prodotti trattandole come un problema di raccomandazione focalizzato sui comportamenti passati degli utenti. Questo metodo è efficiente, specialmente per le query popolari, dove può avere un impatto significativo sulle vendite. XWalk funziona bene insieme ad altri metodi di recupero, rendendolo un'aggiunta preziosa ai sistemi di ricerca esistenti. Combinando XWalk con modelli basati su testo e reti neurali, creiamo una potente soluzione di ricerca per l'e-commerce.
Titolo: XWalk: Random Walk Based Candidate Retrieval for Product Search
Estratto: In e-commerce, head queries account for the vast majority of gross merchandise sales and improvements to head queries are highly impactful to the business. While most supervised approaches to search perform better in head queries vs. tail queries, we propose a method that further improves head query performance dramatically. We propose XWalk, a random-walk based graph approach to candidate retrieval for product search that borrows from recommendation system techniques. XWalk is highly efficient to train and inference in a large-scale high traffic e-commerce setting, and shows substantial improvements in head query performance over state-of-the-art neural retreivers. Ensembling XWalk with a neural and/or lexical retriever combines the best of both worlds and the resulting retrieval system outperforms all other methods in both offline relevance-based evaluation and in online A/B tests.
Autori: Jon Eskreis-Winkler, Yubin Kim, Andrew Stanton
Ultimo aggiornamento: 2023-07-22 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2307.12019
Fonte PDF: https://arxiv.org/pdf/2307.12019
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.