Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Informationsbeschaffung# Maschinelles Lernen

Verbesserung von Empfehlungssystemen durch negatives Feedback

In diesem Artikel geht's darum, wie man Empfehlungssysteme verbessern kann, indem man das negative Feedback von Nutzern nutzt.

― 5 min Lesedauer


Empfehlungssysteme undEmpfehlungssysteme undNutzerfeedbackNutzerfeedback.sorgfältigen Einsatz vonEmpfehlungen verbessern durch den
Inhaltsverzeichnis

Empfehlungssysteme sind Tools, die viele Online-Plattformen nutzen, um Inhalte basierend auf den Vorlieben der Nutzer vorzuschlagen. Diese Systeme analysieren das Nutzerverhalten, wie z.B. was sie anklicken oder mögen, um Artikel zu empfehlen, die ihnen wahrscheinlich gefallen. Das hilft den Nutzern, Produkte oder Inhalte einfacher in einem riesigen Meer von Optionen zu finden.

Bedeutung von Feedback

Nutzerfeedback ist entscheidend für die Verbesserung dieser Systeme. Nutzer geben auf zwei Hauptarten Feedback: positives Feedback, wie Likes oder Klicks, und Negatives Feedback, wie Dislikes oder das Überspringen von Inhalten. Während Systeme oft darauf abzielen, aus positivem Feedback zu lernen, ist es ebenso wichtig, auf negatives Feedback zu hören. Wenn Nutzer signalisieren, dass sie etwas nicht mögen, erwarten sie, dass das System sich schnell anpasst und ähnliche Empfehlungen in Zukunft vermeidet.

Die Herausforderung mit negativem Feedback

Trotz seiner Bedeutung wird negatives Feedback bei der Entwicklung von Empfehlungssystemen oft übersehen. Viele Modelle konzentrieren sich nur darauf, vorherzusagen, was Nutzer mögen werden, basierend auf ihren positiven Interaktionen. Das kann frustrierend für Nutzer sein, wenn das System weiterhin Artikel vorschlägt, die sie bereits abgelehnt haben.

Der traditionelle Ansatz zur Schulung dieser Systeme besteht darin, sich auf positive Nutzerinteraktionen zu optimieren, während negatives Feedback im Lernprozess unberücksichtigt bleibt. Das bedeutet, dass das System möglicherweise nicht effektiv aus dem Input lernt, wenn ein Nutzer etwas nicht mag. Ausserdem ist es schwierig zu messen, wie gut das System auf negatives Feedback reagiert, aufgrund komplizierter Beziehungen zwischen Nutzeraktionen und Systemempfehlungen.

Neuer Ansatz zur Einbeziehung von negativem Feedback

Um dieses Problem zu lösen, wurde eine neue Methode zur Schulung von Empfehlungssystemen eingeführt. Diese Methode umfasst die Einbeziehung sowohl positiven als auch negativen Feedbacks in den Trainingsprozess. So kann das System genauer lernen, was Nutzer wollen und was nicht.

Training mit einer „Nicht-empfehlen“-Strategie

Dieser neue Ansatz verwendet eine spezielle Art von Verlustfunktion, oft als „nicht-empfehlen“-Verlust bezeichnet. Das bedeutet, dass, wenn ein Nutzer einen Artikel nicht mag, dieser Artikel als Trainingslabel verwendet wird, um dem System beizubringen, ihn diesem Nutzer nicht wieder vorzuschlagen. Auf diese Weise kann das Modell direkt aus negativem Feedback lernen und seine Vorhersagen verbessern.

Diese Änderung soll das System reaktionsfähiger machen. Wenn ein Nutzer negatives Feedback gibt, sollte das System nicht nur aufhören, diesen speziellen Artikel vorzuschlagen, sondern auch ähnliche Artikel vermeiden. Das Training des Modells umfasst jetzt sowohl, was empfohlen werden soll, als auch, was nicht empfohlen werden soll, was zu einem besseren Verständnis der Nutzerpräferenzen führt.

Live-Experimente zur Überprüfung des neuen Ansatzes

Um zu sehen, wie gut diese neue Methode funktioniert, wurden Live-Experimente an einem grossangelegten Empfehlungssystem durchgeführt. Die Ergebnisse zeigten, dass die Einbeziehung von negativem Feedback das Gesamterlebnis der Nutzer verbesserte. Das System konnte die Wahrscheinlichkeit verringern, Artikel vorzuschlagen, die den Nutzern nicht gefallen haben.

Modellierung expliziten negativen Feedbacks

In einem Experiment testete das System, wie gut es aus explizitem negativem Feedback, wie Dislikes, lernen konnte. Als das neue Modell die Dislike-Aktionen als Teil des Trainingsprozesses und der Eingabefunktionen verwendete, konnte es die Dislike-Rate im Vergleich zu einem Basismodell, das Dislikes nicht berücksichtigte, erheblich senken.

Die Ergebnisse zeigten, dass das neue Modell besser darin war, ähnliche Empfehlungen in zukünftigen Vorschlägen zu reduzieren, wenn Nutzer Artikel nicht mochten. Diese Reduzierung unerwünschter Empfehlungen half auch, die Anzahl der Nutzer zu senken, die Artikel abgelehnt oder übersprungen haben, was auf ein insgesamt zufriedenstellenderes Erlebnis hinweist.

Modellierung impliziten negativen Feedbacks

Implizites Feedback, wie das Überspringen von Artikeln, wurde ebenfalls getestet. Diese Art von Feedback ist häufiger, da sie öfter vorkommt als explizite Dislikes. Das Experiment beinhaltete übersprungene Artikel als negative Trainingslabels und zeigte eine Verbesserung des Nutzererlebnisses. Nutzer berichteten, dass sie nach der Verwendung dieses Ansatzes zufriedener mit ihren Empfehlungen waren.

Die Fähigkeit, dieses implizite Feedback einzubeziehen, gab dem Modell eine breitere Basis, um die Nutzerpräferenzen zu verstehen. Infolgedessen waren die Empfehlungen vielfältiger und stimmten mehr mit dem überein, was die Nutzer wollten.

Messung der Reaktionsfähigkeit auf Feedback

Während die Live-Experimente Einblicke in die Leistung des neuen Modells gaben, boten sie keinen direkten Weg, um zu messen, wie reaktionsfähig das System auf negatives Feedback war. Um dies zu adressieren, wurde ein kontrafaktuelles Simulationsframework entwickelt. Dieses Framework simuliert Nutzerinteraktionen und hilft zu messen, wie das System reagiert, wenn es negatives Feedback erhält.

Kontrafaktisches Simulationsframework

In diesem Framework interagierten simulierte Nutzer mit Empfehlungen genauso wie echte Nutzer. Wenn ein Nutzer negativ auf einen Artikel reagierte, wurden kontrafaktische Aktionen durchgeführt, um zu sehen, wie das System in verschiedenen Szenarien reagieren würde. Zum Beispiel wurde verglichen, was passierte, wenn ein Nutzer einen Artikel nicht mochte, im Vergleich zu dem Fall, dass er kein Feedback gab.

Durch die Analyse dieser verschiedenen Ergebnisse konnte das Team quantifizieren, wie viel das System ähnliche Empfehlungen als Reaktion auf negatives Feedback reduzierte. Dieser Ansatz half, Nutzerverhalten von Systemantworten zu trennen, was zu einem klareren Verständnis der Effektivität des Modells führte.

Fazit

Diese neue Methode zur Einbeziehung von negativem Nutzerfeedback in Empfehlungssysteme stellt einen wichtigen Fortschritt beim Bau reaktionsfähigerer und nutzerfreundlicherer Tools dar. Durch die Berücksichtigung sowohl positiven als auch negativen Feedbacks während des Trainings können diese Systeme relevantere Vorschläge machen, die mit den Nutzerinteressen übereinstimmen.

Die Einbeziehung von negativem Feedback verbessert nicht nur die Genauigkeit der Empfehlungen, sondern steigert auch die Zufriedenheit der Nutzer. Da die Nutzer weiterhin mit Online-Plattformen interagieren, wird ihr Feedback entscheidend sein, um die Zukunft der Empfehlungssysteme zu gestalten. Die Entwicklung von Techniken zur Messung der Reaktionsfähigkeit auf Feedback wird weiter verfeinern, wie diese Systeme funktionieren, um ein besseres Erlebnis für alle Nutzer zu gewährleisten.

Durch die Annahme dieses dualen Ansatzes für Nutzerfeedback können Unternehmen effektivere Empfehlungstools entwickeln, die den sich ständig ändernden Vorlieben ihrer Nutzer gerecht werden. Während sich die Technologie weiterentwickelt, werden sich auch die Methoden zur Anpassung von Empfehlungen weiterentwickeln, was letztendlich sowohl den Nutzern als auch den Plattformen zugutekommt.

Originalquelle

Titel: Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders

Zusammenfassung: Sequential recommenders have been widely used in industry due to their strength in modeling user preferences. While these models excel at learning a user's positive interests, less attention has been paid to learning from negative user feedback. Negative user feedback is an important lever of user control, and comes with an expectation that recommenders should respond quickly and reduce similar recommendations to the user. However, negative feedback signals are often ignored in the training objective of sequential retrieval models, which primarily aim at predicting positive user interactions. In this work, we incorporate explicit and implicit negative user feedback into the training objective of sequential recommenders in the retrieval stage using a "not-to-recommend" loss function that optimizes for the log-likelihood of not recommending items with negative feedback. We demonstrate the effectiveness of this approach using live experiments on a large-scale industrial recommender system. Furthermore, we address a challenge in measuring recommender responsiveness to negative feedback by developing a counterfactual simulation framework to compare recommender responses between different user actions, showing improved responsiveness from the modeling change.

Autoren: Yueqi Wang, Yoni Halpern, Shuo Chang, Jingchen Feng, Elaine Ya Le, Longfei Li, Xujian Liang, Min-Cheng Huang, Shane Li, Alex Beutel, Yaping Zhang, Shuchao Bi

Letzte Aktualisierung: 2023-08-23 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2308.12256

Quell-PDF: https://arxiv.org/pdf/2308.12256

Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel