Personalisierte Empfehlungen mit generativer KI
Ein neues Framework zur Anpassung generativer Items basierend auf Nutzerinput.
― 5 min Lesedauer
Inhaltsverzeichnis
Empfehlungssysteme sollen Nutzern helfen, Dinge zu finden, die zu ihren Interessen passen. Dazu können Videos, Produkte oder Artikel gehören. Normalerweise arbeiten diese Systeme mit einem festen Set an bereits verfügbaren Artikeln. Kürzlich haben Fortschritte in der generativen KI es ermöglicht, neue Artikel basierend auf Nutzerinput zu erstellen, anstatt nur vorhandene abzurufen. Das bringt eine neue Herausforderung mit sich: Wie können wir diese generativen Artikel für Nutzer personalisieren, wenn es unendlich viele Optionen geben könnte?
In diesem Artikel wird ein Rahmen diskutiert, um diese Herausforderung anzugehen, wobei der Fokus darauf liegt, wie wir Nutzer besser mit den Artikeln verbinden können, die sie wollen, indem wir Aufforderungen oder spezifische Anfragen von Nutzern nutzen, um Modelle abzurufen, die massgeschneiderte Ergebnisse generieren. In unserer Studie stellen wir ein neues Dataset vor, das Tausende von Bildern enthält, die von verschiedenen Modellen mit unterschiedlichen Aufforderungen generiert wurden, und wir erklären, wie wir diese generierten Artikel bewerten können, um am besten zu den Nutzerpräferenzen zu passen.
Personalisierung
Die Herausforderung derPersonalisierung bei generativen Empfehlungen bedeutet, zu verstehen, was einzelne Nutzer mögen. Bei zahlreichen generativen Modellen ist es jedoch unrealistisch, dass Nutzer jede potenzielle Option einzeln überprüfen. Stattdessen schlagen wir eine Lösung vor, die zuerst die Modelle basierend auf Nutzeraufforderungen und -präferenzen eingrenzt. Dieser Prozess besteht aus zwei Hauptschritten: relevante Modelle anhand gegebener Aufforderungen abrufen und die von diesen Modellen generierten Artikel bewerten.
Überblick über den Rahmen
Der von uns vorgeschlagene Rahmen umfasst zwei wichtige Phasen:
Aufforderung-Modell-Abruf: In dieser Phase identifizieren wir, welche generativen Modelle für die Aufforderung des Nutzers am relevantesten sind. Durch die Verwendung eines festen Sets an verschiedenen Aufforderungen können wir visuell bewerten, wie gut verschiedene Modelle abschneiden.
Bewertung der generierten Artikel: Nachdem wir die Auswahl eingegrenzt haben, konzentrieren wir uns darauf, die generierten Artikel dieser ausgewählten Modelle basierend auf Nutzerfeedback zu bewerten. Dieses Feedback gibt Einblicke in die Nutzerpräferenzen.
Das GEMRec-18K Dataset
Um unseren Rahmen zu unterstützen, haben wir ein Dataset namens GEMRec-18K erstellt. Es besteht aus 18.000 Bildern, die mit 200 verschiedenen generativen Modellen und 90 unterschiedlichen Aufforderungen generiert wurden. Dieses Dataset ist entscheidend für die Verbesserung von generativen Empfehlungssystemen, da es uns ermöglicht, zu analysieren, wie gut verschiedene Modelle auf verschiedene Anfragen reagieren. Die Aufforderungen wurden aus verschiedenen Quellen gesammelt, um sicherzustellen, dass sie eine breite Palette an Themen und Stilen abdecken.
Bedeutung der Nutzerinteraktion
Ein effektives Empfehlungssystem muss die Nutzerinteraktion fördern. Der vorgeschlagene Rahmen ermöglicht es Nutzern, die generierten Bilder über eine interaktive Schnittstelle anzusehen und zu bewerten. Dadurch können Nutzer ausdrücken, was ihnen gefällt oder nicht, was dem System ermöglicht, im Laufe der Zeit zu lernen und sich zu verbessern. Die erste Phase, Aufforderung-Modell-Abruf, lässt Nutzer die Ausgaben verschiedener Modelle vergleichen. Die zweite Phase, Bewertung der generierten Artikel, ermöglicht es Nutzern, Bilder basierend auf ihren Präferenzen anzuordnen und wertvolles Feedback zu geben, um zukünftige Empfehlungen zu verfeinern.
Untersuchung der generierten Bilder
Wir haben die Vielfalt und Qualität der Bilder analysiert, die von verschiedenen Modellen erstellt wurden. Indem wir die Unterschiede zwischen generierten Bildern für die gleiche Aufforderung untersuchen, können wir sehen, wie einzigartig oder ähnlich die Ausgaben sind. Diese Analyse hilft zu verstehen, welche Modelle vielfältige Ergebnisse produzieren und welche dazu neigen, ähnliche Bilder zu generieren.
Einschränkungen der aktuellen Metriken
Die Bewertung der Effektivität generativer Modelle ist nicht einfach. Aktuelle Metriken konzentrieren sich oft auf Beliebtheit oder Genauigkeit, aber diese allein geben kein vollständiges Bild. Beliebte Modelle könnten ähnliche Ergebnisse liefern, was die Vielfalt einschränken kann. Daher benötigen wir eine umfassendere Metrik, die nicht nur die Qualität der generierten Bilder, sondern auch deren Vielfalt bewertet.
Bewertung mit einer neuen Metrik
Um die Einschränkungen bestehender Bewertungstechniken zu beheben, führen wir eine neue Metrik ein, die Generative Recommendation Evaluation Score (GRE-Score) genannt wird. Dieser Score berücksichtigt verschiedene Faktoren, einschliesslich wie gut die generierten Bilder zu den Aufforderungen passen und die Vielfalt der Ausgaben. Mit dieser neuen Metrik können wir eine mehr umfassende Bewertung der Leistung jedes Modells bieten.
Zukünftige Richtungen
Unsere Erkenntnisse bilden die Grundlage für mehrere zukünftige Forschungsansätze. Eine Richtung ist die Erweiterung des GEMRec-Datensatzes, indem noch mehr Aufforderungen und Modelle aufgenommen werden. Dies wird den Personalisierungsaspekt unseres Rahmens verbessern. Zudem wollen wir Studien mit Nutzern durchführen, um zu sehen, wie sie mit unserem System interagieren und Daten sammeln, um die Modellauswahl weiter zu verfeinern.
Ein weiterer wichtiger Aspekt ist die Etablierung standardisierter Bewertungsmethoden für generative Empfehlungen. Das Verständnis individueller Präferenzen ist entscheidend, und wir müssen Metriken entwickeln, die die Vorlieben der Nutzer genau widerspiegeln. Schliesslich, obwohl sich unsere Studie auf die Bildgenerierung konzentriert, glauben wir, dass die Prinzipien auch auf andere Bereiche wie Text- oder Musikgenerierung angewendet werden können.
Fazit
Die Integration von generativer KI in Empfehlungssysteme eröffnet spannende neue Möglichkeiten für personalisierte Empfehlungen. Durch den Vorschlag eines strukturierten Rahmens, der Nutzerfeedback und innovative Bewertungsmetriken einbezieht, können wir das Nutzererlebnis bei der Erkundung generierter Artikel verbessern. Unsere Arbeit dient als Sprungbrett auf dem fortlaufenden Weg, effektivere und personalisierte generative Empfehlungssysteme zu schaffen.
Titel: GEMRec: Towards Generative Model Recommendation
Zusammenfassung: Recommender Systems are built to retrieve relevant items to satisfy users' information needs. The candidate corpus usually consists of a finite set of items that are ready to be served, such as videos, products, or articles. With recent advances in Generative AI such as GPT and Diffusion models, a new form of recommendation task is yet to be explored where items are to be created by generative models with personalized prompts. Taking image generation as an example, with a single prompt from the user and access to a generative model, it is possible to generate hundreds of new images in a few minutes. How shall we attain personalization in the presence of "infinite" items? In this preliminary study, we propose a two-stage framework, namely Prompt-Model Retrieval and Generated Item Ranking, to approach this new task formulation. We release GEMRec-18K, a prompt-model interaction dataset with 18K images generated by 200 publicly-available generative models paired with a diverse set of 90 textual prompts. Our findings demonstrate the promise of generative model recommendation as a novel personalization problem and the limitations of existing evaluation metrics. We highlight future directions for the RecSys community to advance towards generative recommender systems. Our code and dataset are available at https://github.com/MAPS-research/GEMRec.
Autoren: Yuanhe Guo, Haoming Liu, Hongyi Wen
Letzte Aktualisierung: 2023-12-06 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2308.02205
Quell-PDF: https://arxiv.org/pdf/2308.02205
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.
Referenz Links
- https://huggingface.co/models?pipeline
- https://midjourney.com
- https://civitai.com
- https://github.com/civitai/civitai/wiki/REST-API-Reference
- https://huggingface.co/docs/diffusers/api/pipelines/overview
- https://beta.dreamstudio.ai/prompt-guide
- https://docs.midjourney.com/docs/prompts
- https://github.com/MAPS-research/GEMRec
- https://dl.acm.org/ccs.cfm