Migliorare la Rilevanza della Ricerca nell'E-Commerce
Un nuovo metodo migliora l'accuratezza della ricerca dei prodotti nello shopping online.
― 7 leggere min
Indice
- Importanza della Rilevanza nell'E-Commerce
- Sfide nel Calcolo della Rilevanza Semantica
- Soluzione Proposta
- Schema di Rappresentazione di Lunghezza Dinamica
- Strategia di Riconoscimento di Termini Professionali
- Meccanismo di Addestramento Avversariale Contrastivo
- Valutazione dei Metodi Proposti
- Valutazioni Offline
- Testing Online A/B
- Conclusione
- Fonte originale
- Link di riferimento
Nel mondo dello shopping online, arrivare ai prodotti giusti per i clienti è fondamentale. Quando i clienti digitano quello che cercano, è importante che il motore di ricerca restituisca articoli che corrispondono ai loro bisogni. Il modo in cui avviene questo abbinamento si chiama calcolo della rilevanza semantica, e gioca un ruolo importante per garantire che i clienti abbiano una buona esperienza quando cercano prodotti.
Tradizionalmente, i motori di ricerca usavano un abbinamento testuale semplice, che spesso perdeva di vista cosa volevano davvero i clienti. Metodi più recenti, compresi i reti neurali, sono diventati popolari perché riescono a gestire ricerche complesse meglio. Tuttavia, molti sistemi esistenti hanno difficoltà a generalizzare e a essere affidabili in diverse situazioni. Questo articolo discute un nuovo approccio che mira a risolvere questi problemi utilizzando metodi di ricerca e abbinamento basati sull'interazione.
Importanza della Rilevanza nell'E-Commerce
Quando i consumatori fanno shopping online, l'efficacia del motore di ricerca si basa su due compiti principali: capire cosa vogliono i clienti in base alle loro query e analizzare le abitudini di acquisto dai clic precedenti. Per avere successo, un motore di ricerca deve non solo classificare gli articoli in modo efficace ma anche verificare che i prodotti mostrati siano appropriati per ciascuna query.
Nell'e-commerce, il calcolo della rilevanza semantica (SRC) è fondamentale. Prende le parole chiave in query brevi e le abbina a descrizioni di prodotti più lunghe per valutare e classificare gli articoli con precisione. Se un motore di ricerca si concentra troppo sui clic senza capire l'intento dell'utente, può portare a una diminuzione dell'attenzione da parte degli utenti e a un calo delle vendite.
Sfide nel Calcolo della Rilevanza Semantica
Il calcolo della rilevanza semantica è diverso dai compiti generali di abbinamento testuale. Affronta sfide specifiche:
Capire l'Intento dell'Utente: Le query spesso mancano di chiarezza. Ad esempio, una ricerca per "sconto mela nuova" potrebbe significare cose diverse, come una vendita di mele fresche o un affare su gadget Apple. Abbinare queste query ambigue in modo preciso con prodotti pertinenti è difficile.
Bilanciare Velocità e Accuratezza: Le piattaforme di e-commerce devono essere veloci. Anche se le ricerche di parole chiave tradizionali sono rapide, spesso non classificano i risultati in modo accurato. I modelli neurali sono migliori nel catturare relazioni tra parole, ma richiedono più potenza di calcolo, il che può rallentare tutto.
Gestire un Uso Linguistico Diversificato: Culture diverse utilizzano termini vari per lo stesso concetto. Ad esempio, "sconto del 50%" può essere espresso in molti modi. Questa diversità Complica il funzionamento dei modelli, perché potrebbero non riconoscere tutte le espressioni in modo accurato.
Soluzione Proposta
Questo pezzo introduce un nuovo metodo per modellare la rilevanza nelle ricerche e-commerce. Si concentra su tre aspetti principali:
Rappresentazione di Lunghezza Dinamica: Questa strategia aggiusta la dimensione dell'input in base alla lunghezza delle query e delle descrizioni dei prodotti. Questa flessibilità aiuta a ottimizzare le risorse di calcolo.
Riconoscimento di Termini Professionali: Questo implica migliorare il vocabolario del modello per includere termini specifici del settore, il che aiuta il modello a comprendere e rappresentare meglio le descrizioni dei prodotti.
Addestramento Avversariale Contrastivo: Questo metodo aumenta la robustezza del modello. Addestrando con diversi esempi contemporaneamente, crea una migliore comprensione di vari input.
Schema di Rappresentazione di Lunghezza Dinamica
Una parte chiave del nostro approccio è lo schema di rappresentazione di lunghezza dinamica. La differenza tra come funzionano i modelli basati su rappresentazione e quelli basati su interazione sta nel modo in cui gestiscono le query.
Modelli Basati su Rappresentazione: Questi convertono le query in vettori di lunghezza fissa. Anche se questo rende il processo di calcolo più veloce, può semplificare eccessivamente le sfumature del comportamento dell'utente e portare a risultati meno accurati.
Modelli Basati su Interazione: Questi elaborano la query in tempo reale, combinandola con le descrizioni dei prodotti per creare una comprensione più dettagliata. Questo però può essere pesante in termini di risorse.
Per risolvere questo, il nostro metodo accorcia le lunghezze dei token eliminando padding non necessari. Inoltre, pre-calcoliamo i token per le query frequenti, rendendo la ricerca più veloce e semplice.
Strategia di Riconoscimento di Termini Professionali
Un altro ostacolo a una ricerca efficace è la tokenizzazione tradizionale, che non funziona bene per il gergo specifico del mondo e-commerce. Ad esempio, i termini specializzati possono essere mal gestiti se non vengono riconosciuti correttamente.
Per affrontare questo, il nostro metodo amplia il vocabolario utilizzato nel modello includendo termini specifici del settore frequentemente usati derivati da un ampio set di dati. Inoltre, implementiamo il Riconoscimento di Entità Nominate (NER) per identificare oggetti chiave e attributi all'interno delle query e delle descrizioni dei prodotti. Questo consente un abbinamento più accurato aiutando il modello a riconoscere termini pertinenti che vanno oltre il vocabolario generale.
Meccanismo di Addestramento Avversariale Contrastivo
Una questione significativa con i modelli tradizionali è la loro mancanza di adattabilità a coppie query-prodotto sconosciute. Per affrontare questo, il nostro metodo impiega l'addestramento avversariale contrastivo, che migliora l'accuratezza delle previsioni del modello riducendo la sensibilità alle variazioni di input.
Questo metodo addestra il modello a riconoscere non solo l'input ma anche le sue uscite, regolando simultaneamente entrambi. Utilizzando esempi avversariali durante l'addestramento, il modello diventa più robusto contro le variazioni nelle query. Questo metodo aiuta il modello a imparare rappresentazioni migliori di ciò che gli utenti si aspettano in base ai loro termini di ricerca.
Valutazione dei Metodi Proposti
Per convalidare l'efficacia del nostro nuovo approccio, abbiamo condotto estese valutazioni offline utilizzando un ampio set di coppie query-prodotto e abbiamo eseguito rigorosi test online A/B.
Valutazioni Offline
Abbiamo raccolto 80 milioni di coppie query-prodotto basate sui clic degli utenti e creato un set più piccolo di 250.000 coppie annotate manualmente. Ogni coppia è stata valutata per rilevanza, il che significa che doveva soddisfare criteri specifici basati su argomenti e parole chiave. In questo modo, abbiamo potuto testare quanto bene il nostro modello si sarebbe comportato rispetto ai modelli tradizionali.
Vari modelli consolidati hanno servito come benchmark per il confronto, e il nostro nuovo approccio ha costantemente superato questi. In particolare, la nostra strategia ha mostrato notevoli miglioramenti in metriche come accuratezza, tassi di clic e tassi di conversione.
Testing Online A/B
Il nostro modello è stato integrato nella piattaforma di ricerca Alibaba.com, che ha un vasto pubblico e un alto volume di transazioni. Abbiamo implementato tre strategie chiave gradualmente, permettendoci di misurare il loro impatto sui tassi di clic, tassi di conversione e entrate.
I risultati sono stati impressionanti, con aumenti notevoli in tutte e tre le metriche dopo ogni fase di implementazione. L'ultima fase di addestramento avversariale contrastivo ha prodotto i guadagni più significativi e ha dimostrato che il nostro approccio ha avuto un effetto positivo tangibile sull'esperienza dell'utente e sulle vendite.
Conclusione
Il metodo interattivo proposto per modellare la rilevanza semantica nei motori di ricerca e-commerce offre un approccio fresco ed efficace per migliorare i risultati di ricerca. Utilizzando uno schema di rappresentazione di lunghezza dinamica, una strategia per riconoscere termini professionali e addestramento avversariale contrastivo, questo metodo migliora significativamente la rilevanza dei risultati di ricerca.
Le nostre ampie valutazioni sottolineano la sua efficacia e robustezza, dimostrando che può soddisfare le esigenze quotidiane di milioni di utenti portando a miglioramenti sostanziali nei tassi di clic e conversione. Questo approccio è stato operante con successo su una delle più grandi piattaforme di e-commerce per oltre un anno e mostra promesse per future applicazioni in campi correlati.
I progressi compiuti in questo studio aprono la strada a esperienze di ricerca più ricche e accurate che beneficiano sia gli utenti che le aziende.
Titolo: Robust Interaction-Based Relevance Modeling for Online e-Commerce Search
Estratto: Semantic relevance calculation is crucial for e-commerce search engines, as it ensures that the items selected closely align with customer intent. Inadequate attention to this aspect can detrimentally affect user experience and engagement. Traditional text-matching techniques are prevalent but often fail to capture the nuances of search intent accurately, so neural networks now have become a preferred solution to processing such complex text matching. Existing methods predominantly employ representation-based architectures, which strike a balance between high traffic capacity and low latency. However, they exhibit significant shortcomings in generalization and robustness when compared to interaction-based architectures. In this work, we introduce a robust interaction-based modeling paradigm to address these shortcomings. It encompasses 1) a dynamic length representation scheme for expedited inference, 2) a professional terms recognition method to identify subjects and core attributes from complex sentence structures, and 3) a contrastive adversarial training protocol to bolster the model's robustness and matching capabilities. Extensive offline evaluations demonstrate the superior robustness and effectiveness of our approach, and online A/B testing confirms its ability to improve relevance in the same exposure position, resulting in more clicks and conversions. To the best of our knowledge, this method is the first interaction-based approach for large e-commerce search relevance calculation. Notably, we have deployed it for the entire search traffic on alibaba.com, the largest B2B e-commerce platform in the world.
Autori: Ben Chen, Huangyu Dai, Xiang Ma, Wen Jiang, Wei Ning
Ultimo aggiornamento: 2024-09-25 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2406.02135
Fonte PDF: https://arxiv.org/pdf/2406.02135
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.