Le système de recommandation de Pinterest : Façonner ton expérience
Découvrez comment Pinterest personnalise ton fil d'actualité avec des systèmes de recommandation intelligents.
Siddarth Malreddy, Matthew Lawhon, Usha Amrutha Nookala, Aditya Mantha, Dhruvil Deven Badani
― 8 min lire
Table des matières
- Qu'est-ce que les systèmes de recommandation ?
- Les défis des contraintes industrielles
- Améliorer les interactions entre caractéristiques
- Le modèle de classement du fil d'accueil
- Différents expérimentations pour optimiser le modèle
- Choisir les bonnes architectures
- Métriques de succès
- A/B Testing et amélioration continue
- Conclusion
- Source originale
- Liens de référence
Dans le monde des plateformes en ligne où tout le monde essaie d'attirer ton attention, Pinterest se démarque comme un géant avec plus de 500 millions d'utilisateurs actifs chaque mois. C'est un endroit où les utilisateurs se rassemblent pour trouver et sauvegarder des idées—pense à ça comme un tableau numérique plein d'inspirations créatives. Maintenant, le défi pour Pinterest, c'est de s'assurer que quand tu te connectes, les premières choses que tu vois sont exactement ce que tu pourrais aimer. C'est là que les Systèmes de recommandation entrent en jeu. Ces systèmes sont comme ton assistant personnel de shopping, te guidant vers des trucs que tu ne savais même pas que tu avais besoin.
Mais créer des systèmes de recommandation efficaces n'est pas facile, surtout dans un espace aussi compétitif que Pinterest. C'est comme essayer de trouver ton snack préféré dans une pièce remplie jusqu'au plafond de snacks. Il faut quelques stratégies intelligentes pour s'assurer que tu choisis les bons.
Qu'est-ce que les systèmes de recommandation ?
Les systèmes de recommandation, en termes simples, sont des algorithmes qui analysent ton comportement et tes préférences pour prédire ce que tu pourrais vouloir voir ensuite. Ils prennent en compte les choses que tu as aimées, sauvegardées ou même ignorées dans le passé et utilisent ces informations pour personnaliser ton expérience. Imagine un vieux pote qui se souvient de ton dessert préféré et qui sait toujours l'apporter à la fête.
Le système de recommandation de Pinterest est composé de trois étapes principales : récupération, classement et mélange. L'étape de récupération rassemble une variété d'options pour toi, l'étape de classement attribue un score à ces options en fonction de la probabilité que tu interagisses avec elles, et enfin, le mélange combine tout pour afficher les options les plus pertinentes sur ton fil.
Les défis des contraintes industrielles
Bien que la recherche académique puisse être assez libre, les applications réelles font souvent face à une multitude de contraintes. Pense à ça comme ça : un universitaire peut se permettre d'essayer une recette de chaque manière possible jusqu'à ce qu'il trouve la meilleure. Pendant ce temps, un chef dans un restaurant fréquent doit s'en tenir à des recettes éprouvées qui peuvent être servies rapidement sans trop de coûts.
Parmi les principaux défis auxquels sont confrontés les systèmes de recommandation dans le monde réel, on trouve :
-
Latence du modèle : C'est une façon sophistiquée de dire "à quelle vitesse pouvons-nous te donner des résultats ?" Si le modèle met trop de temps, cela affecte l'expérience utilisateur et peut même augmenter les coûts pour maintenir le système.
-
Limitations de mémoire : Chaque modèle doit être efficace dans l'utilisation de ses ressources. Pense à ça comme essayer de faire entrer un énorme canapé dans un petit salon ; si ça ne passe pas, ça va créer un mal de tête.
-
Reproductibilité du modèle : Quand un système se comporte de manière incohérente, c'est comme jouer à un jeu où les règles changent à chaque fois que tu joues. Maintenir la cohérence aide les équipes à comprendre leurs progrès et leurs impacts.
Améliorer les interactions entre caractéristiques
Un des aspects les plus vitaux des systèmes de recommandation, c'est les interactions entre caractéristiques. Ces interactions sont comme des relations entre différents facteurs qui aident le système à comprendre le comportement des utilisateurs. Par exemple, si tu sauvegardes souvent des recettes de gâteaux, le système pourrait relier cet intérêt à ton amour pour la pâtisserie et suggérer plus de recettes qui correspondent.
Pinterest s'est concentré sur l'amélioration de ces interactions dans son modèle de classement du fil d'accueil. Pour faire ça efficacement sous les contraintes mentionnées ci-dessus, une approche systématique est nécessaire. L'entreprise a examiné diverses stratégies et compromis pour reproduire le succès des théories académiques dans des applications pratiques.
Le modèle de classement du fil d'accueil
Au cœur du système de recommandation de Pinterest se trouve le modèle de classement du fil d'accueil. Ce modèle prédit la probabilité que tu interagisses avec différents Pins en fonction de ton comportement passé. Il prend en compte différents types de données :
- Caractéristiques denses : Ce sont des valeurs numériques qui doivent être ajustées pour l'exactitude.
- Caractéristiques rares : Ce sont des caractéristiques catégorielles ou basées sur du texte, et elles ont souvent besoin d'un peu de magie—également connu sous le nom d'embeddings—pour clarifier leur signification.
- Caractéristiques contextuelles : Celles-ci aident le modèle à comprendre ce qui se passe à l'instant, comme l'heure de la journée ou les sujets tendance.
Le modèle de classement fonctionne en faisant passer ces informations à travers des couches conçues pour identifier comment différentes caractéristiques interagissent entre elles. C'est comme un ami essayant de déterminer si tu vas aimer un film en le comparant à tes favoris précédents.
Différents expérimentations pour optimiser le modèle
Pour s'assurer que le modèle est robuste, Pinterest a mené diverses expériences axées sur l'amélioration des interactions entre caractéristiques. C'est comme une foire scientifique, mais au lieu de volcans et de bicarbonate de soude, ils mesuraient des données et des interactions.
-
Augmenter les ordres d'interaction : En ajoutant plus de couches pour l'interaction des caractéristiques, l'équipe a découvert qu'ils pouvaient améliorer efficacement l'engagement des utilisateurs sans rencontrer de problèmes de mémoire. C'est comme empiler des blocs de construction plus haut—juste assure-toi qu'ils ne tombent pas !
-
Interactions parallèles : Au lieu de s'appuyer sur une seule méthode d'interaction, le système peut maintenant évaluer plusieurs approches simultanément. Comme essayer plusieurs mouvements de danse en même temps pour voir lequel améliore la performance globale.
-
Ajouter de la non-linéarité : C'est l'incorporation de relations plus complexes entre les caractéristiques. Ça peut être difficile, mais ça aide à créer une compréhension plus nuancée des préférences des utilisateurs.
Choisir les bonnes architectures
À travers les expériences, Pinterest a examiné diverses architectures qui promettent un apprentissage plus efficace des interactions entre caractéristiques. Ils ont comparé comment ces architectures performaient sous les contraintes qu'ils rencontraient.
Par exemple, des méthodes traditionnelles comme DeepFM et Wide & Deep ont montré des promesses dans des contextes académiques mais ont trébuché dans des applications réelles à cause de la complexité accrue et de la latence. L'équipe de Pinterest devait s'assurer que les modèles seraient suffisamment efficaces pour gérer l'énorme volume de données sans créer de retards ou d'instabilités.
Métriques de succès
Pour évaluer le succès de leurs modèles, Pinterest utilise plusieurs métriques importantes :
-
HIT@3/save Metric : Cela mesure combien des trois Pins recommandés en tête un utilisateur sauvegarde. C'est comme voir combien de tes amis ont aimé le dessert que tu as apporté à un repas partagé.
-
Utilisation de mémoire : Garde un œil sur combien de mémoire GPU est utilisée pendant l'entraînement. Plus de mémoire peut signifier de meilleures performances, mais si ça dépasse certaines limites, ça peut causer des problèmes.
-
Latence : Cela suit à quelle vitesse le modèle peut fournir des recommandations. Un léger retard peut causer de la frustration, donc il est crucial de garder ça sous contrôle.
A/B Testing et amélioration continue
Une fois qu'une nouvelle architecture de modèle est établie, Pinterest utilise le Test A/B. Cela signifie montrer une version du service à la moitié des utilisateurs et une version alternative à l'autre moitié. L'objectif ? Analyser quelle version performe mieux en termes d'engagement des utilisateurs et de retours. Pense à ça comme essayer deux recettes différentes dans la cuisine pour voir laquelle est dévorée plus rapidement.
La mise en œuvre d'une nouvelle architecture peut conduire à des résultats passionnants, mais l'équipe reste vigilante, toujours à la recherche de moyens d'améliorer le modèle et d'assurer la cohérence des expériences utilisateurs.
Conclusion
Construire un système de recommandation pour une grande plateforme comme Pinterest est une aventure complexe remplie d'obstacles et d'opportunités d'amélioration. En prenant en compte soigneusement les contraintes, en menant des expériences ciblées et en utilisant la technologie, Pinterest vise à offrir à ses utilisateurs une expérience inspirante et personnalisée.
Tout comme la création de la recette parfaite, le voyage est en cours. L'équipe de Pinterest continue d'apprendre de ses expériences et d'adapter ses systèmes, s'assurant que chaque utilisateur se sente comme s'il avait un assistant personnel dédié à l'aider à découvrir les joyaux créatifs qu'il recherche. Donc, la prochaine fois que tu te connecteras et verras un Pin qui résonne, souviens-toi qu'en coulisses, beaucoup de réflexion et de travail d'ingénierie ont rendu cette découverte possible.
Source originale
Titre: Improving feature interactions at Pinterest under industry constraints
Résumé: Adopting advances in recommendation systems is often challenging in industrial settings due to unique constraints. This paper aims to highlight these constraints through the lens of feature interactions. Feature interactions are critical for accurately predicting user behavior in recommendation systems and online advertising. Despite numerous novel techniques showing superior performance on benchmark datasets like Criteo, their direct application in industrial settings is hindered by constraints such as model latency, GPU memory limitations and model reproducibility. In this paper, we share our learnings from improving feature interactions in Pinterest's Homefeed ranking model under such constraints. We provide details about the specific challenges encountered, the strategies employed to address them, and the trade-offs made to balance performance with practical limitations. Additionally, we present a set of learning experiments that help guide the feature interaction architecture selection. We believe these insights will be useful for engineers who are interested in improving their model through better feature interaction learning.
Auteurs: Siddarth Malreddy, Matthew Lawhon, Usha Amrutha Nookala, Aditya Mantha, Dhruvil Deven Badani
Dernière mise à jour: 2024-12-02 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2412.01985
Source PDF: https://arxiv.org/pdf/2412.01985
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.