Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Informationsbeschaffung# Maschinelles Lernen

Verbesserung der Klickrate-Vorhersagen mit GLSM

Ein neues Modell verbessert die Vorhersagen über das Klickverhalten von Nutzern online.

― 5 min Lesedauer


GLSM verbessertGLSM verbessertCTR-Vorhersageneffektiv.Neues Modell steigert die Klickrate
Inhaltsverzeichnis

Die Vorhersage der Klickrate (CTR) geht darum, zu schätzen, wie wahrscheinlich es ist, dass jemand online auf einen Artikel klickt. Das ist wichtig für Unternehmen, die bessere Empfehlungen und Werbung geben wollen. Zu verstehen, was Nutzer mögen, basierend auf ihren Aktionen, ist entscheidend. Nutzer haben sowohl langfristige Interessen (was sie über einen längeren Zeitraum mögen) als auch kurzfristige Interessen (was sie gerade jetzt mögen könnten). Viele Forscher und Unternehmen suchen nach Wegen, um diese Nutzerverhalten besser zu verstehen, aber es gibt noch Herausforderungen.

Das Problem

Es gibt zwei Hauptprobleme mit den aktuellen Methoden. Erstens, Regeln zu nutzen, um Informationen aus langfristigen Verhaltensweisen zu finden, kann wichtige Details verlieren. Zweitens, nur eine Art von Aktion für kurzfristige Verhaltensweisen zu betrachten, kann die Informationen durcheinanderbringen und Rauschen erzeugen. Das bedeutet, dass Unternehmen möglicherweise nicht verstehen, was Nutzer wirklich wollen.

Unsere Lösung

Um diese Probleme anzugehen, stellen wir ein neues Modell vor, das Graph-basiertes Lang- und Kurzzeitinteressenmodell (GLSM) heisst. Dieses Modell nutzt ein grafisches Layout, um das Nutzerverhalten über die Zeit zu erfassen. Es hat zwei Teile: einen für langfristiges Verhalten und einen für kurzfristiges Verhalten. Das Modell hat auch einen Weg, Informationen aus beiden Verhaltensarten zu kombinieren, was zu besseren Vorhersagen führt.

Wie es funktioniert

GLSM basiert auf drei Hauptkomponenten:

  1. Graph-basierte Langzeitinteresse-Abfrage: Dieser Teil nutzt eine Graphstruktur, um langfristige Nutzerinteressen effizient zu finden. Es identifiziert die wichtigen Aspekte des Nutzerverhaltens, ohne sich von irrelevanten Informationen ablenken zu lassen.

  2. Kurzfristige Multi-Intent-Erkennung: Dieser Teil betrachtet die kurzfristigen Nutzerinteressen in verschiedenen Situationen. Das ist wichtig, weil ein Nutzer je nach dem, was er gerade macht oder wo er ist, unterschiedliche Vorlieben haben kann.

  3. Fusion von Lang- und Kurzzeitinteressen: Diese Komponente kombiniert langfristige und kurzfristige Interessen auf eine personalisierte Weise und versteht, dass verschiedene Nutzer unterschiedliche Bedürfnisse haben.

Vorteile unseres Ansatzes

Unser Modell hat in Experimenten vielversprechende Ergebnisse gezeigt. Es kann Klicks genauer vorhersagen als viele bestehende Methoden. Wir haben Tests mit realen Datensätzen durchgeführt, und das GLSM hat andere Modelle um einen signifikanten Abstand übertroffen.

Langfristige Verhaltenabfrage

Der erste Teil des GLSM konzentriert sich auf die Abfrage des langfristigen Verhaltens. Viele Nutzer führen über die Zeit viele Aktionen durch, was manchmal die Dinge verwirren kann. GLSM erstellt einen Graphen dieser Aktionen und findet die relevantesten, um sie dem Modell hinzuzufügen, während es das Rauschen ignoriert. Die Abfrage beginnt von wichtigen Knoten, die Nutzerinteressen repräsentieren, sodass wir sehen können, was für den Nutzer am wichtigsten ist.

Das Ziel hier ist, die langfristige Abfolge von Nutzeraktionen in nützliche Informationen zu vereinfachen, die die CTR-Vorhersagen verbessern können. Es organisiert das Nutzerverhalten in Cluster basierend auf Ähnlichkeiten. Das Modell schaut sich an, wie diese Aktionen mit dem, was der Nutzer mag, verbunden sind, und nutzt einen Graph, um herauszufinden, welche Verhaltensweisen am stärksten mit aktuellen Interessen verknüpft sind.

Kurzfristige Multi-Intent-Erkennung

Für die kurzfristigen Interessen teilt GLSM Nutzeraktionen in verschiedene Szenarien auf. Zum Beispiel könnte sich das Verhalten eines Nutzers am Morgen von dem während des Mittag- oder Abendessens unterscheiden. Das ist notwendig, weil die gleiche Person je nach Tageszeit unterschiedliche Dinge wollen könnte.

Das Modell nutzt ein GRU (Gated Recurrent Unit), um den Fluss der Nutzerinteressen zu erfassen. Anstatt sich auf eine einzige Art von Aktion zu konzentrieren, erkennt es, dass Nutzer mehrere Absichten zur gleichen Zeit haben können. Zum Beispiel könnte ein Nutzer sich Essensoptionen ansehen, während er seine Mahlzeiten für den Tag plant.

Durch die Aufschlüsselung kurzfristiger Nutzeraktionen auf diese Weise erfasst GLSM ein detaillierteres Bild der Nutzerinteressen und hilft, relevante Verhaltensweisen herauszupicken, ohne unverknüpfte Aktionen zu vermischen.

Kombination von Lang- und Kurzzeitinteressen

Der nächste Schritt ist, die langfristigen und kurzfristigen Interessen effektiv zu kombinieren. Nicht alle Nutzerverhalten haben das gleiche Gewicht; ein stabiles langfristiges Interesse könnte einflussreicher sein als eine kurzfristige Laune. GLSM nutzt einen personalisierten Ansatz, um ein Gleichgewicht zwischen diesen beiden Seiten zu schaffen.

Zum Beispiel, wenn ein Nutzer häufig Schuhe kauft, wird dieses langfristige Interesse mehr Gewicht haben als ein kürzliches Interesse an Party-Outfits. Das Modell lernt, diese Gewichte basierend auf den Nutzermerkmalen anzupassen, was zu relevanteren Artikelvorhersagen führt.

Implementierung in der realen Welt

Die Implementierung von GLSM in einem Live-System bringt eigene Herausforderungen mit sich. Online-Dienste müssen schnell reagieren, oft in nur Millisekunden, während sie mit grossen Mengen an Nutzerverhaltensdaten umgehen. Um das zu bewältigen, betreibt GLSM ein schnelles Abfragesystem, das neben anderen Teilen des Empfehlungsprozesses funktioniert.

Durch die effiziente Organisation historischer Nutzeraktionen reduziert GLSM die Zeit und die Ressourcen, die für die CTR-Vorhersage benötigt werden. Es übernimmt die schwere Arbeit der Verhaltensabfrage im Voraus, was es einfach macht, relevante Informationen abzurufen, wenn Nutzer mit dem System interagieren.

Experimentelle Ergebnisse

Wir haben GLSM mit vielen Basislinienmodellen anhand öffentlicher und industrieller Datensätze bewertet. Das Modell zeigte in verschiedenen Metriken überlegene Leistungen. Nicht nur verbesserte GLSM die Klickrate, sondern es steigerte auch das gesamte Nutzerengagement.

Zum Beispiel haben wir GLSM mit Daten aus einer beliebten mobilen Anwendung getestet, wo es einen signifikanten Anstieg der CTR und des Gesamtumsatzes erreichte. Diese Ergebnisse zeigen, dass die Kombination von langfristigen und kurzfristigen Interessen zu besseren Empfehlungen führen kann, was zu höherer Nutzerzufriedenheit und einem gesteigerten Geschäftswert führt.

Fazit

Zusammenfassend bietet das Graph-basierte Lang- und Kurzzeitinteressenmodell einen neuen Weg, um das Nutzerverhalten in Online-Empfehlungssystemen zu verstehen. Indem es langfristige Erinnerungen und kurzfristige Absichten separat betrachtet und dann intelligent zusammenführt, kann GLSM die Komplexität von Nutzerinteressen besser erfassen als bestehende Modelle.

Durch effektive Abfragestrategien und ein gutes Verständnis der Nutzungsszenarien bietet es ein leistungsstarkes Werkzeug zur Verbesserung von Online-Empfehlungssystemen. Während sich Online-Plattformen weiterentwickeln, helfen Modelle wie GLSM sicherzustellen, dass Unternehmen die Bedürfnisse der Nutzer besser erfüllen und ihr digitales Erlebnis insgesamt verbessern können.

Originalquelle

Titel: Graph Based Long-Term And Short-Term Interest Model for Click-Through Rate Prediction

Zusammenfassung: Click-through rate (CTR) prediction aims to predict the probability that the user will click an item, which has been one of the key tasks in online recommender and advertising systems. In such systems, rich user behavior (viz. long- and short-term) has been proved to be of great value in capturing user interests. Both industry and academy have paid much attention to this topic and propose different approaches to modeling with long-term and short-term user behavior data. But there are still some unresolved issues. More specially, (1) rule and truncation based methods to extract information from long-term behavior are easy to cause information loss, and (2) single feedback behavior regardless of scenario to extract information from short-term behavior lead to information confusion and noise. To fill this gap, we propose a Graph based Long-term and Short-term interest Model, termed GLSM. It consists of a multi-interest graph structure for capturing long-term user behavior, a multi-scenario heterogeneous sequence model for modeling short-term information, then an adaptive fusion mechanism to fused information from long-term and short-term behaviors. Comprehensive experiments on real-world datasets, GLSM achieved SOTA score on offline metrics. At the same time, the GLSM algorithm has been deployed in our industrial application, bringing 4.9% CTR and 4.3% GMV lift, which is significant to the business.

Autoren: Huinan Sun, Guangliang Yu, Pengye Zhang, Bo Zhang, Xingxing Wang, Dong Wang

Letzte Aktualisierung: 2023-06-05 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2306.10028

Quell-PDF: https://arxiv.org/pdf/2306.10028

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel