Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations# Intelligence artificielle

Améliorer les systèmes de recommandation avec une nouvelle approche neuronale

Une nouvelle méthode améliore la façon dont les systèmes apprennent les préférences des utilisateurs de manière efficace.

― 8 min lire


Réseaux de neurones pourRéseaux de neurones pourde meilleuresrecommandationsutilisateurs.l'apprentissage des préférences desUne nouvelle méthode améliore
Table des matières

Les Systèmes de recommandation sont des outils qui aident les gens à trouver des trucs ou du contenu qu’ils pourraient aimer en fonction de leurs intérêts. On les utilise sur plein de plateformes en ligne, comme les services de streaming et les sites de e-commerce. Un bon système de recommandation ne se contente pas de suggérer des trucs populaires, mais propose aussi du contenu frais et pertinent aux utilisateurs. Cependant, les méthodes traditionnelles galèrent souvent à deviner ce que les utilisateurs pourraient aimer qu'ils n'ont pas encore vu. Cette limite vient de leur dépendance aux données passées et aux intérêts connus des utilisateurs.

Ces dernières années, des améliorations ont été faites grâce à une méthode appelée Bandits contextuels. Cette technique permet aux systèmes d'explorer de nouvelles options tout en utilisant ce qu'ils savent déjà. Mais ces approches avancées peuvent être très exigeantes en ressources informatiques, rendant leur utilisation difficile dans des situations réelles.

Ce travail vise à créer une nouvelle façon efficace d'utiliser ces méthodes dans les systèmes de recommandation. L'objectif est de simplifier l'apprentissage du système sur ce que les utilisateurs aiment tout en maintenant les coûts informatiques bas.

Le Besoin de Meilleurs Systèmes de Recommandation

Les systèmes de recommandation jouent un rôle clé dans la façon dont les gens trouvent des infos dans le vaste monde d'internet. Ils aident à personnaliser le contenu pour chaque utilisateur, améliorant ainsi leur expérience globale. Traditionnellement, ces systèmes utilisaient des algorithmes d'apprentissage supervisé, qui analysent de grandes quantités de données pour cerner les préférences des utilisateurs. Mais ces méthodes ont tendance à s'en tenir à des sujets familiers et ne sont pas très douées pour découvrir de nouveaux intérêts pour les utilisateurs.

Beaucoup de systèmes de recommandation se concentrent uniquement sur les intérêts connus des utilisateurs, ce qui les rend moins Efficaces pour suggérer du nouveau contenu. Cette approche peut conduire à une gamme étroite de recommandations, passant à côté d'objets potentiellement intéressants pour les utilisateurs. La capacité d’un système à découvrir les préférences cachées des utilisateurs est essentielle pour un succès à long terme.

Explorer l'Apprentissage par Bandits Contextuels

Le concept d'Exploration dans les systèmes de recommandation vient d'un domaine connu sous le nom d'apprentissage par bandits. Dans ce contexte, le système agit comme un agent qui interagit avec les utilisateurs. Chaque utilisateur représente un contexte différent, et chaque suggestion faite est considérée comme une action. Les algorithmes de bandits, comme l'échantillonnage de Thompson et la borne de confiance supérieure (UCB), permettent aux systèmes d'explorer de nouvelles options tout en faisant des recommandations.

Bien que des recherches aient montré que ces méthodes fonctionnent bien dans de petits tests, les systèmes de recommandation réels nécessitent des approches capables de gérer de plus grandes quantités de données et des situations plus complexes. Les approches de bandits basées sur des réseaux neuronaux offrent plus de flexibilité mais peuvent être trop gourmandes en ressources pour une utilisation pratique.

Un défi majeur de ces méthodes est l'estimation efficace de l'Incertitude. Un agent doit savoir ce qu'il ne sait pas pour guider son exploration efficacement. Alors que les méthodes existantes pourraient y parvenir, elles nécessitent souvent trop de calcul, limitant leur application pratique.

Présentation de la Recommandation Neurale Épistémique

Pour relever ce défi, nous proposons une nouvelle architecture de réseau neuronal appelée Recommandation Neurale Épistémique (RNE). Ce design vise à faciliter l'apprentissage des systèmes de recommandation sur les utilisateurs sans utiliser trop de ressources.

Représentations Informatiques

Une partie essentielle du fonctionnement de la RNE est de créer des représentations efficaces à la fois des utilisateurs et du contenu. Cela inclut trois éléments principaux : la représentation de l'action (la suggestion), la représentation du contexte (l'utilisateur), et comment ces deux éléments interagissent.

Pour ce faire, les données brutes des caractéristiques des utilisateurs et des objets sont transformées en formes plus utiles. Ce processus aide à garantir que le système peut analyser et apprendre efficacement des données qu'il reçoit. En faisant cela correctement, le système peut mieux comprendre le lien entre les utilisateurs et le contenu qu'ils pourraient aimer.

Amélioration de l'Exploration

La RNE utilise l'information recueillie des utilisateurs et du contenu pour faire de meilleures suppositions sur ce qui pourrait intéresser un utilisateur ensuite. En échantillonnant une gamme de possibilités, le système peut offrir des suggestions plus diversifiées. Cette exploration est cruciale car elle permet au système d'apprendre de nouveaux intérêts qui n'avaient peut-être pas été envisagés auparavant.

L'architecture permet au système d'employer l'estimation de l'incertitude de manière efficace. Cela signifie que lorsque le système n'est pas sûr des préférences d'un utilisateur, il peut choisir d'explorer différentes options au lieu de se fier à du contenu familier. Cette capacité peut mener à des expériences utilisateurs plus riches et plus personnalisées.

Expérimentation avec des Données Réelles

Nous avons mené une série d'expériences pour tester les performances de la RNE. Ces expériences utilisaient de grands ensembles de données avec des millions d'interactions de vrais utilisateurs, offrant ainsi un moyen précieux d'évaluer l'efficacité du système dans des scénarios réels.

Les tests ont comparé la RNE à plusieurs méthodes existantes, y compris des stratégies de bandits traditionnelles comme l'échantillonnage de Thompson, l'UCB, et diverses approches de réseaux neuronaux. En observant les performances de la RNE, on peut voir ses avantages tant en exploration qu'en efficacité.

Résultats de l'Ensemble de Données MIND

Une des expériences clés impliquait l'ensemble de données MIND, qui provient d'un système de recommandation d'actualités. Cet ensemble de données comprend des journaux détaillés des interactions des utilisateurs, nous permettant de suivre comment différents systèmes performent dans la suggestion d'articles.

Dans cette expérience, la RNE a montré une amélioration significative par rapport aux autres méthodes en termes de taux de clics et d'évaluations des utilisateurs. Elle a obtenu ces résultats tout en nécessitant moins d'interactions pour apprendre les préférences des utilisateurs. Cet avantage est particulièrement important car cela signifie que les utilisateurs sont moins sollicités, rendant le système plus convivial.

Résultats de l'Ensemble de Données KuaiRec

Un autre ensemble de données important testé était KuaiRec, qui présente presque l'intégralité des interactions utilisateurs-objets. Cet ensemble de données complet nous a permis d'évaluer comment la RNE pouvait s'adapter à des scénarios réels avec une grande variété de recommandations disponibles.

Encore une fois, la RNE a surpassé les autres stratégies. Elle a démontré de bonnes performances tant dans les interactions des utilisateurs que dans les évaluations, mettant en avant son efficacité dans des environnements du monde réel. Les résultats indiquent que la RNE peut effectivement généraliser à partir des interactions utilisateurs connues pour faire des recommandations précises pour du contenu non vu.

Conclusions Clés et Implications

Les expériences montrent clairement que la RNE offre une manière plus efficace de réaliser l'exploration dans les systèmes de recommandation. En fournissant une architecture évolutive qui exige moins de ressources, la RNE ouvre la voie à son utilisation dans diverses applications.

La capacité de la RNE à améliorer la personnalisation tout en gérant efficacement l'incertitude représente une avancée significative dans le domaine. Cette amélioration a des implications sur la façon dont les entreprises peuvent adopter des systèmes de recommandation avancés sans encourir de lourds coûts informatiques.

De plus, les résultats des deux ensembles de données suggèrent que la RNE n'est pas seulement une solution théorique ; elle est pratique et applicable aux défis réels auxquels les systèmes de recommandation font face aujourd'hui.

Conclusion

En résumé, le développement de la RNE représente une avancée dans l'évolution des systèmes de recommandation. En intégrant des stratégies d'exploration avec un accent sur l'efficacité computationnelle, la RNE fournit un outil précieux pour améliorer la façon dont les utilisateurs découvrent de nouveau contenu.

La recherche met en lumière le potentiel de combiner des algorithmes avancés avec des architectures de réseaux neuronaux efficaces pour relever des défis de longue date en matière de personnalisation. De futurs travaux peuvent s'appuyer sur cette base, affinant encore l'approche et explorant de nouvelles applications.

L'espoir est que plus d'entreprises et de plateformes adoptent ces méthodes innovantes, menant à des expériences utilisateurs plus riches et à des interactions plus gratifiantes avec le contenu numérique. À mesure que la technologie continue d'évoluer, des outils comme la RNE seront essentiels pour naviguer dans le vaste paysage des intérêts et préférences des utilisateurs.

Source originale

Titre: Scalable Neural Contextual Bandit for Recommender Systems

Résumé: High-quality recommender systems ought to deliver both innovative and relevant content through effective and exploratory interactions with users. Yet, supervised learning-based neural networks, which form the backbone of many existing recommender systems, only leverage recognized user interests, falling short when it comes to efficiently uncovering unknown user preferences. While there has been some progress with neural contextual bandit algorithms towards enabling online exploration through neural networks, their onerous computational demands hinder widespread adoption in real-world recommender systems. In this work, we propose a scalable sample-efficient neural contextual bandit algorithm for recommender systems. To do this, we design an epistemic neural network architecture, Epistemic Neural Recommendation (ENR), that enables Thompson sampling at a large scale. In two distinct large-scale experiments with real-world tasks, ENR significantly boosts click-through rates and user ratings by at least 9% and 6% respectively compared to state-of-the-art neural contextual bandit algorithms. Furthermore, it achieves equivalent performance with at least 29% fewer user interactions compared to the best-performing baseline algorithm. Remarkably, while accomplishing these improvements, ENR demands orders of magnitude fewer computational resources than neural contextual bandit baseline algorithms.

Auteurs: Zheqing Zhu, Benjamin Van Roy

Dernière mise à jour: 2023-08-18 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2306.14834

Source PDF: https://arxiv.org/pdf/2306.14834

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires