Empfehlungen mit positiver Artikelauffrischung verbessern
Eine neue Methode verbessert die Genauigkeit und Vielfalt von Empfehlungssystemen.
― 6 min Lesedauer
Inhaltsverzeichnis
Personalisierte Empfehlungssysteme helfen den Nutzern, Dinge zu finden, die ihnen wahrscheinlich gefallen, basierend auf ihrem bisherigen Verhalten. Ein häufiges Problem dieser Systeme ist jedoch ein Mangel an ausreichenden Daten. Viele Nutzer interagieren vielleicht nicht mit genug Artikeln, damit das System ihre Vorlieben genau verstehen kann. Das führt zu schlechten Empfehlungen, da das System Schwierigkeiten hat, herauszufinden, was die Nutzer wollen.
Um die Empfehlungen zu verbessern, ist es wichtig, zusätzliche positive Beispiele von Artikeln zu erstellen, die den Nutzern gefallen könnten. Das nennt man positive Artikelaugmentation. Einfach mehr Artikel hinzuzufügen, reicht aber nicht aus. Das System muss sicherstellen, dass diese hinzugefügten Artikel sowohl genau als auch vielfältig sind, um zu vermeiden, dass die Nutzer immer wieder die gleichen Inhalte präsentiert bekommen.
Das Problem der Datensparsamkeit
In vielen Empfehlungssystemen haben Nutzer nur minimale Klick-, Kauf- oder View-Historien im Vergleich zu der riesigen Anzahl verfügbarer Artikel. Denk mal an die Anzahl der Artikel auf Plattformen wie Streaming-Diensten oder E-Commerce-Seiten. Nutzer haben vielleicht nur mit einer Handvoll dieser Artikel interagiert, was zu einem spärlichen Verständnis ihrer tatsächlichen Vorlieben führt. Diese Datensparsamkeit macht es den Empfehlungsalgorithmen schwer, zu erkennen, was die Nutzer interessiert.
Um dieses Problem zu bekämpfen, haben viele Forscher verschiedene Methoden untersucht, um die Menge an positivem Feedback für das Training zu erhöhen. Einige Ansätze holen Informationen aus verschiedenen Quellen oder betrachten sogar das Verhalten von Nutzern mit ähnlichen Interessen. Eine andere Methode ist, neue Beispiele innerhalb desselben Datensatzes zu erstellen, um das Training zu verbessern, ohne externe Informationen zu benötigen.
Ansatz zur positiven Artikelaugmentation
Die vorgeschlagene Methode konzentriert sich darauf, ein genaueres und vielfältigeres Set positiver Artikelbeispiele zu erstellen. Dazu werden potenzielle Artikel aus verschiedenen Perspektiven gesammelt. Zuerst schaut das System sich das frühere Verhalten eines Nutzers an, um Artikel zu finden, die sowohl mit seinen langfristigen als auch kurzzeitigen Interessen übereinstimmen. Das geschieht durch drei Hauptstrategien:
- User to Item Retrieval (u2i): Diese Strategie sammelt Artikel, basierend auf den Gesaminteressen eines Nutzers, unter Berücksichtigung seines langfristigen Verhaltens.
- Item to Item Retrieval (i2i): Diese Methode konzentriert sich auf die unmittelbaren Interessen des Nutzers, die direkt mit den Artikeln verbunden sind, mit denen er interagiert hat.
- User to User to Item Retrieval (u2u2i): Diese Strategie schaut, was ähnliche Nutzer gemocht haben und empfiehlt diese Artikel.
Sobald diese potenziellen positiven Artikel gesammelt sind, wendet das System eine Methode namens Selbst-Destillation an. Das ist eine Möglichkeit, die ausgewählten Artikel zu überprüfen und zu verfeinern, um sicherzustellen, dass sie von hoher Qualität und abwechslungsreich genug sind, um verschiedenen Nutzergeschmäckern gerecht zu werden.
Verbesserung der Empfehlungen
Das Ziel ist es, die Empfehlungen genauer und vielfältiger zu machen. Wenn neue positive Artikel in den Trainingsprozess eingeführt werden, sollten sie dem Modell helfen, besser zu lernen. Vielfältige Empfehlungen können die Nutzer engagiert halten und verhindern, dass sie in einer Schleife stecken bleiben, in der sie immer wieder die gleichen Arten von Inhalten sehen.
Um die Wirksamkeit des vorgeschlagenen Systems zu messen, haben die Forscher Tests sowohl offline (mit historischen Daten) als auch online (in realen Umgebungen) durchgeführt. Dazu gehörte ein A/B-Test, bei dem das neue System mit bestehenden Methoden verglichen wurde, um zu sehen, ob es wirklich bessere Empfehlungen bot.
Experimentation und Ergebnisse
In den Bewertungen zeigte das vorgeschlagene System deutliche Verbesserungen gegenüber bestehenden Methoden. Die Forschung wurde mit zwei grossen Datensätzen durchgeführt. Der erste bestand aus Millionen von Nutzern und Artikeln, was präzises Testen in einer realen Umgebung ermöglichte.
In diesen Experimenten wurden Massnahmen wie die Häufigkeit, mit der Nutzer auf empfohlene Artikel geklickt haben (Klickrate), und die allgemeine Nutzerzufriedenheit verfolgt. Die Ergebnisse zeigten, dass die neue Methode die Anzahl positiver Interaktionen erhöhen konnte, was darauf hindeutet, dass Nutzer eher mit den vorgeschlagenen Artikeln interagiert haben.
Durch die Nutzung der drei Retrieval-Strategien konnte das System eine grosse Vielfalt an Empfehlungen sammeln. Die Ergebnisse zeigten, dass die Nutzer im Vergleich zu traditionellen Methoden, die hauptsächlich auf dem basierten, mit dem, was die Nutzer zuvor engagiert hatten, eine vielfältigere Auswahl an Vorschlägen erhielten.
Online-Test
Um die Wirksamkeit der Methode zu bestätigen, wurde ein Online-A/B-Test durchgeführt. In diesem Test wurde das neue Empfehlungssystem in die Praxis umgesetzt, sodass echte Nutzer die Änderungen erfahren konnten. Die Leistung wurde anhand von zwei Hauptmetriken bewertet: durchschnittliche Wiedergaben pro Kopf und Abschlussquote von Videos.
Die Ergebnisse waren vielversprechend. Als das traditionelle System durch die neue Methode ersetzt wurde, wurden in beiden Metriken signifikante Verbesserungen verzeichnet. Das deutete darauf hin, dass die Nutzer nicht nur mehr zu sehen fanden, sondern auch länger bei den Inhalten blieben.
Verständnis von Vielfalt in Empfehlungen
Vielfalt in Empfehlungen ist entscheidend. Das hilft, das sogenannte "Filterblasen"-Phänomen zu vermeiden, bei dem Nutzer nur einen engen Bereich von Inhalten sehen, die sie bereits kennen und mögen. Die neue Methode zeigte, dass sie eine grössere Vielfalt an Artikeln an die Nutzer liefern konnte. Dies wurde durch die Analyse validiert, wie viele unterschiedliche Artikel im Vergleich zur traditionellen Methode empfohlen wurden.
Durch die Bewertung der Einzigartigkeit in den Empfehlungen war es klar, dass der neue Ansatz den Nutzern über dreimal so viele einzigartige Artikel zur Verfügung stellte. Diese Vielfalt kann das Nutzererlebnis verbessern und die Engagement-Levels hoch halten.
Fazit und zukünftige Richtungen
Die positive Artikelaugmentation ist ein wesentlicher Bestandteil der Verbesserung von Empfehlungssystemen. Durch die Kombination von Methoden zur Sammlung eines vielfältigen Sets potenzieller Empfehlungen und deren Verfeinerung durch Selbst-Destillation hat dieser neue Ansatz sich als effektiv erwiesen.
Die Implementierung dieser Methode in realen Systemen zeigt ihren praktischen Wert und hat Auswirkungen auf eine grosse Anzahl von Nutzern. Zukünftige Arbeiten werden sich damit beschäftigen, noch mehr Möglichkeiten zur Verbesserung positiver Artikel-Empfehlungen zu schaffen und zu analysieren, wie verschiedene Anpassungen den Nutzern weiter zugutekommen können.
Indem der Fokus auf die Verbesserung von Genauigkeit und Vielfalt gelegt wird, ist das Ziel, ein Empfehlungssystem zu schaffen, das die individuellen Nutzerpräferenzen wirklich versteht und darauf eingeht, um sicherzustellen, dass die Nutzer engagiert und zufrieden mit den Inhalten bleiben, die sie erhalten.
Titel: Learning from All Sides: Diversified Positive Augmentation via Self-distillation in Recommendation
Zusammenfassung: Personalized recommendation relies on user historical behaviors to provide user-interested items, and thus seriously struggles with the data sparsity issue. A powerful positive item augmentation is beneficial to address the sparsity issue, while few works could jointly consider both the accuracy and diversity of these augmented training labels. In this work, we propose a novel model-agnostic Diversified self-distillation guided positive augmentation (DivSPA) for accurate and diverse positive item augmentations. Specifically, DivSPA first conducts three types of retrieval strategies to collect high-quality and diverse positive item candidates according to users' overall interests, short-term intentions, and similar users. Next, a self-distillation module is conducted to double-check and rerank these candidates as the final positive augmentations. Extensive offline and online evaluations verify the effectiveness of our proposed DivSPA on both accuracy and diversity. DivSPA is simple and effective, which could be conveniently adapted to other base models and systems. Currently, DivSPA has been deployed on multiple widely-used real-world recommender systems.
Autoren: Chong Liu, Xiaoyang Liu, Ruobing Xie, Lixin Zhang, Feng Xia, Leyu Lin
Letzte Aktualisierung: 2023-08-15 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2308.07629
Quell-PDF: https://arxiv.org/pdf/2308.07629
Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.