Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Informationsbeschaffung# Rechnen und Sprache

Verbesserung der Suchrelevanz im E-Commerce

Eine neue Methode verbessert die Suchgenauigkeit von Produkten beim Online-Shopping.

― 6 min Lesedauer


E-CommerceE-CommerceSuchrelevanzmethodebei der Online-Shopping-Suche.Neuer Ansatz verbessert die Genauigkeit
Inhaltsverzeichnis

Im Online-Shopping ist es super wichtig, die richtigen Produkte zu den Kunden zu bringen. Wenn Käufer eingeben, wonach sie suchen, muss die Suchmaschine Artikel zurückgeben, die ihren Bedürfnissen entsprechen. Das Matching dieser Produkte nennt man semantische Relevanzberechnung und das spielt eine grosse Rolle dafür, dass die Kunden eine gute Erfahrung beim Suchen von Produkten haben.

Traditionell haben Suchmaschinen einfaches Textmatching verwendet, was oft nicht das getroffen hat, was die Kunden wirklich wollten. Neuere Methoden, inklusive neuronaler Netzwerke, sind populär geworden, weil sie komplexe Suchen besser handhaben können. Viele bestehende Systeme haben jedoch Schwierigkeiten, wenn es darum geht, zu verallgemeinern und in verschiedenen Situationen zuverlässig zu sein. In diesem Artikel geht es um einen neuen Ansatz, der darauf abzielt, diese Probleme zu beheben, indem er interaktionsbasierte Methoden für die Produktsuche und -zuordnung verwendet.

Bedeutung der Relevanz im E-Commerce

Wenn Verbraucher online einkaufen, hängt die Effektivität der Suchmaschine von zwei Hauptaufgaben ab: herauszufinden, was die Kunden basierend auf ihren Anfragen wollen und das Kaufverhalten anhand vorheriger Klicks zu analysieren. Damit eine Suchmaschine erfolgreich ist, muss sie nicht nur die Artikel effektiv sortieren, sondern auch prüfen, ob die angezeigten Produkte für jede Anfrage passend sind.

Im E-Commerce ist die semantische Relevanzberechnung (SRC) entscheidend. Sie nimmt die Kernwörter in kurzen Anfragen und vergleicht sie mit längeren Produktbeschreibungen, um Artikel genau zu bewerten und zu ranken. Wenn eine Suchmaschine zu sehr auf Klicks fokussiert ist, ohne die Benutzerabsicht zu verstehen, kann das zu weniger Aufmerksamkeit und geringeren Verkaufszahlen führen.

Herausforderungen bei der semantischen Relevanzberechnung

Die semantische Relevanzberechnung unterscheidet sich von allgemeinen Textmatching-Aufgaben. Sie sieht sich spezifischen Herausforderungen gegenüber:

  1. Verstehen der Benutzerabsicht: Anfragen sind oft unklar. Zum Beispiel könnte eine Suche nach "neuen Apfel Rabatt" unterschiedliche Bedeutungen haben, wie einen Verkauf von frischen Äpfeln oder ein Angebot für Apple-Geräte. Diese mehrdeutigen Anfragen genau mit relevanten Produkten zu verbinden, ist schwierig.

  2. Ausgewogenheit zwischen Geschwindigkeit und Genauigkeit: E-Commerce-Plattformen müssen schnell sein. Während traditionelle Keyword-Suchen schnell sind, ranken sie die Ergebnisse oft nicht genau. Neuronale Modelle sind besser darin, Beziehungen zwischen Wörtern zu erfassen, benötigen aber mehr Rechenleistung, was die Dinge verlangsamen kann.

  3. Umgang mit vielfältigen Sprachgebrauch: Verschiedene Kulturen verwenden verschiedene Begriffe für dasselbe Konzept. Zum Beispiel kann "50% Rabatt" auf viele Arten ausgedrückt werden. Diese Vielfalt erschwert es, wie gut die Modelle funktionieren, da sie möglicherweise nicht alle Ausdrücke genau erkennen.

Vorgeschlagene Lösung

Dieser Artikel stellt eine neue Methode zur Modellierung von Relevanz in E-Commerce-Suchen vor. Sie konzentriert sich auf drei Hauptaspekte:

  1. Dynamische Längenrepräsentation: Diese Strategie passt die Eingabedauer an die Länge der Anfragen und Produktbeschreibungen an. Diese Flexibilität hilft, die Rechenressourcen zu optimieren.

  2. Erkennung von Fachbegriffen: Dies beinhaltet die Verbesserung des Wortschatzes des Modells, um branchenspezifische Begriffe einzuschliessen, was dem Modell hilft, Produktbeschreibungen besser zu verstehen und darzustellen.

  3. Kontrastive adversariale Ausbildung: Diese Methode erhöht die Robustheit des Modells. Durch das gleichzeitige Trainieren mit unterschiedlichen Beispielen entsteht ein besseres Verständnis für verschiedene Eingaben.

Dynamische Längenrepräsentationsschema

Ein zentraler Teil unseres Ansatzes ist das dynamische Längenrepräsentationsschema. Der Unterschied zwischen wie repräsentationsbasierte und interaktionsbasierte Modelle arbeiten, liegt darin, wie sie Anfragen handhaben.

  • Repräsentationsbasierte Modelle: Diese wandeln Anfragen in Vektoren fester Länge um. Obwohl das den Rechenprozess beschleunigt, kann es die Nuancen des Benutzerverhaltens übersimplifizieren und zu weniger genauen Ergebnissen führen.

  • Interaktionsbasierte Modelle: Diese verarbeiten die Anfrage in Echtzeit und kombinieren sie mit Produktbeschreibungen, um ein detaillierteres Verständnis zu schaffen. Diese Echtzeitverarbeitung kann jedoch ressourcenintensiv sein.

Um das zu lösen, kürzt unsere Methode die Tokenlängen, indem unnötige Füllzeichen entfernt werden. Ausserdem berechnen wir Tokens für häufige Anfragen im Voraus, um die Suche schneller und einfacher zu machen.

Strategie zur Erkennung von Fachbegriffen

Ein weiteres Hindernis für effektives Suchen ist die traditionelle Tokenisierung, die nicht gut für spezifisches Fachjargon im E-Commerce geeignet ist. Zum Beispiel können spezialisierte Begriffe falsch behandelt werden, wenn sie nicht korrekt erkannt werden.

Um dies anzugehen, erweitert unsere Methode den Wortschatz, der im Modell verwendet wird, indem häufig verwendete branchenspezifische Begriffe aus einem grossen Datensatz einbezogen werden. Zusätzlich implementieren wir die Named Entity Recognition (NER), um wichtige Objekte und Attribute innerhalb von Anfragen und Produktbeschreibungen zu identifizieren. Das ermöglicht eine genauere Zuordnung, da das Modell relevante Begriffe erkennt, die über den allgemeinen Wortschatz hinausgehen.

Mechanismus des kontrastiven adversarialen Trainings

Ein grosses Problem traditioneller Modelle ist ihre mangelnde Anpassungsfähigkeit an unbekannte Anfrage-Artikel-Paare. Um dem entgegenzuwirken, verwendet unsere Methode kontrastives adversariales Training, das die Genauigkeit der Vorhersagen des Modells verbessert und gleichzeitig die Sensibilität gegenüber Variationen in den Eingaben verringert.

Diese Methode trainiert das Modell, nicht nur die Eingaben, sondern auch die Ausgaben zu erkennen, indem sie beide gleichzeitig anpasst. Durch die Verwendung von adversarialen Beispielen während des Trainings wird das Modell robuster gegenüber Variationen in den Anfragen. Diese Methode hilft dem Modell, bessere Darstellungen dessen zu lernen, was Benutzer basierend auf ihren Suchbegriffen erwarten.

Bewertung der vorgeschlagenen Methoden

Um die Effektivität unseres neuen Ansatzes zu validieren, haben wir umfassende Offline-Bewertungen mit einem grossen Set an Anfrage-Artikel-Paaren durchgeführt und rigorose Online-A/B-Tests gemacht.

Offline-Bewertungen

Wir haben 80 Millionen Anfrage-Artikel-Paare basierend auf Benutzerklicks gesammelt und ein kleineres Set von 250.000 manuell annotierten Paaren erstellt. Jedes Paar wurde auf Relevanz bewertet, was bedeutet, dass es spezifische Kriterien basierend auf dem Thema und den Schlüsselwörtern erfüllen musste. So konnten wir testen, wie gut unser Modell im Vergleich zu traditionellen Modellen abschneidet.

Verschiedene etablierte Modelle dienten als Benchmarks für den Vergleich, und unser neuer Ansatz hat diese Models konsequent übertroffen. Besonders unsere Strategie zeigte deutliche Verbesserungen in Metriken wie Genauigkeit, Klickrate und Konversionsrate.

Online A/B-Tests

Unser Modell wurde in die Suchplattform von Alibaba.com integriert, die eine riesige Nutzerbasis und ein hohes Volumen an Transaktionen hat. Wir haben drei zentrale Strategien schrittweise implementiert, um deren Auswirkungen auf Klickrate, Konversionsrate und Umsatz zu messen.

Die Ergebnisse waren beeindruckend, mit spürbaren Steigerungen in allen drei Metriken nach jeder Implementierungsphase. Der letzte Schritt des kontrastiven adversarialen Trainings brachte die grössten Gewinne und zeigte, dass unser Ansatz einen greifbaren positiven Effekt auf die Benutzererfahrung und den Verkauf hatte.

Fazit

Die vorgeschlagene interaktionsbasierte Methode zur Modellierung der semantischen Relevanz in E-Commerce-Suchmaschinen bietet einen frischen und effektiven Ansatz zur Verbesserung der Suchergebnisse. Durch die Nutzung eines dynamischen Längenrepräsentationsschemas, einer Strategie zur Erkennung von Fachbegriffen und kontrastivem adversarialem Training verbessert diese Methode erheblich die Relevanz der Suchergebnisse.

Unsere umfassenden Bewertungen unterstreichen die Effektivität und Robustheit, was zeigt, dass sie die täglichen Anforderungen von Millionen von Nutzern erfüllen kann und zu erheblichen Verbesserungen in Klickrate und Konversionen führt. Dieser Ansatz ist seit über einem Jahr erfolgreich auf einer der grössten E-Commerce-Plattformen im Einsatz und zeigt Potenzial für künftige Anwendungen in verwandten Bereichen.

Die Fortschritte, die in dieser Studie erzielt wurden, ebnen den Weg für reichhaltigere, genauere Sucherlebnisse, die sowohl den Nutzern als auch den Unternehmen zugutekommen.

Originalquelle

Titel: Robust Interaction-Based Relevance Modeling for Online e-Commerce Search

Zusammenfassung: Semantic relevance calculation is crucial for e-commerce search engines, as it ensures that the items selected closely align with customer intent. Inadequate attention to this aspect can detrimentally affect user experience and engagement. Traditional text-matching techniques are prevalent but often fail to capture the nuances of search intent accurately, so neural networks now have become a preferred solution to processing such complex text matching. Existing methods predominantly employ representation-based architectures, which strike a balance between high traffic capacity and low latency. However, they exhibit significant shortcomings in generalization and robustness when compared to interaction-based architectures. In this work, we introduce a robust interaction-based modeling paradigm to address these shortcomings. It encompasses 1) a dynamic length representation scheme for expedited inference, 2) a professional terms recognition method to identify subjects and core attributes from complex sentence structures, and 3) a contrastive adversarial training protocol to bolster the model's robustness and matching capabilities. Extensive offline evaluations demonstrate the superior robustness and effectiveness of our approach, and online A/B testing confirms its ability to improve relevance in the same exposure position, resulting in more clicks and conversions. To the best of our knowledge, this method is the first interaction-based approach for large e-commerce search relevance calculation. Notably, we have deployed it for the entire search traffic on alibaba.com, the largest B2B e-commerce platform in the world.

Autoren: Ben Chen, Huangyu Dai, Xiang Ma, Wen Jiang, Wei Ning

Letzte Aktualisierung: 2024-09-25 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2406.02135

Quell-PDF: https://arxiv.org/pdf/2406.02135

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel