Améliorer le classement des recherches en ligne pour le shopping
Combiner des données à long et court terme pour de meilleurs résultats de recherche de produits.
Qi Liu, Atul Singh, Jingbo Liu, Cun Mu, Zheng Yan, Jan Pedersen
― 8 min lire
Table des matières
- Le Défi des Fenêtres Temporelles dans les Features Comportementales
- Analyser les Fenêtres Temporelles
- Le Premier Test : Fenêtres Longues vs Courtes
- Le Deuxième Test : Combinaison des Fenêtres Longues et Courtes
- La Meilleure Approche : Intégration des Caractéristiques Verticales
- Tester le Modèle Intégré
- Conclusion
- Travaux Futurs
- Source originale
- Liens de référence
Faire des courses en ligne fait maintenant partie du quotidien de beaucoup de gens. Ça offre plein d'avantages, comme la commodité, une large gamme de produits, des prix plus bas, et un accès facile via les mobiles. Avec l'augmentation des produits disponibles en ligne, un bon système de classement des produits est super important. Ce système aide les clients à trouver rapidement les produits les plus pertinents.
Au cœur de ces systèmes de classement, il y a un modèle qui utilise l'apprentissage automatique. Ces modèles prennent en compte plein de signaux différents pour déterminer quels produits doivent être affichés en haut des résultats de recherche. Ces signaux peuvent venir de diverses sources, comme le comportement des utilisateurs, ce qu'ils veulent acheter, les détails des produits, et la réputation des vendeurs.
Parmi tous ces signaux, la façon dont les clients interagissent avec les produits - comme les clics, les achats, et l'ajout d'articles au panier - est super importante. Des études montrent que ce genre de retour des clients est clé pour décider comment les produits sont classés. Les clients sont les meilleurs juges de la pertinence des produits par rapport à leurs recherches, surtout quand ces décisions mènent à des achats. Et en plus, recueillir ce feedback est simple et pas cher, ce qui fait de ces signaux comportementaux le cœur des Modèles de classement.
Le Défi des Fenêtres Temporelles dans les Features Comportementales
Malgré les recherches existantes sur l'utilisation des Caractéristiques Comportementales dans le classement, un gros problème reste principalement non résolu : déterminer les meilleures fenêtres de temps à considérer pour ces caractéristiques. Les fenêtres de temps de retour font référence aux périodes pendant lesquelles les données d'engagement des clients sont collectées pour évaluer la pertinence des produits. Trouver la bonne fenêtre est essentiel pour utiliser efficacement ces fonctionnalités dans les classements.
Cet article partage des idées tirées de l'expérience pratique dans l'industrie et examine comment différentes fenêtres temporelles peuvent affecter les classements de recherche de produits. Il se penche spécifiquement sur les effets des fenêtres temporelles longues et courtes et propose une méthode pour combiner les deux types pour de meilleurs résultats. L'efficacité de cette approche combinée est testée avec de vraies données d'achats en ligne.
Analyser les Fenêtres Temporelles
En regardant comment la longueur des différentes fenêtres temporelles peut impacter les modèles de classement, on considère trois types principaux d'engagement utilisateur : les taux de clics, les taux d'ajout au panier, et les taux de commande. Ces taux sont calculés en fonction du comportement des clients pendant des périodes spécifiques.
Utiliser une fenêtre plus longue permet de capturer le Comportement à long terme, ce qui nous renseigne sur les intérêts des clients. Cependant, ça peut rater les tendances récentes. À l'inverse, une fenêtre courte se concentre sur les comportements actuels, ce qui peut refléter les changements dans les tendances d'achat mais ne montre pas forcément les intérêts durables des clients. Chaque approche a ses propres forces et faiblesses.
Pour analyser les effets de ces deux types de caractéristiques comportementales, on définit une longue fenêtre de retour comme deux ans et une courte comme un mois. On crée quatre modèles de classement pour tester ces différentes configurations.
- Modèle de Base : Utilise uniquement des caractéristiques comportementales sur 2 ans.
- Modèle A : Utilise uniquement des caractéristiques comportementales sur 1 mois.
- Modèle B : Utilise à la fois des caractéristiques comportementales sur 2 ans et sur 1 mois.
- Modèle C : Intègre les deux types de caractéristiques ainsi que des informations spécifiques à la requête.
Le Premier Test : Fenêtres Longues vs Courtes
Dans le premier ensemble de tests, on compare la performance du Modèle de Base (caractéristiques comportementales sur 2 ans) avec le Modèle A (caractéristiques comportementales sur 1 mois). Le but ici est de comprendre les impacts distincts des deux longueurs de fenêtres temporelles.
Les résultats montrent que même si le Modèle A performe généralement moins bien que le Modèle de Base, il y a des différences intéressantes entre les catégories de produits. Par exemple, les caractéristiques à court terme ont mieux fonctionné pour des catégories comme l'Électronique, les Jouets, et les produits saisonniers. En revanche, les caractéristiques à long terme ont mieux fonctionné pour des catégories plus stables, comme la Nourriture et les Consommables.
Cette découverte suggère que les deux types de caractéristiques ont des avantages uniques, ce qui rend tentant de trouver un moyen de les combiner pour des résultats optimaux.
Le Deuxième Test : Combinaison des Fenêtres Longues et Courtes
En s'appuyant sur les insights du premier test, on met en place un deuxième test comparant le Modèle de Base au Modèle B, qui inclut à la fois des caractéristiques à court et long terme. Ici, on s'attend à ce que la combinaison de ces caractéristiques donne de meilleurs résultats.
Cependant, les résultats indiquent que combiner ces caractéristiques ne donne pas de bons résultats en général. Dans plusieurs catégories, y compris la Nourriture et les Consommables, la performance a même diminué. Cela suggère que simplement fusionner les deux types de caractéristiques peut diluer leur efficacité.
Pour illustrer, pour la catégorie Nourriture, les forces des caractéristiques longues ont été réduites quand elles ont été combinées avec des caractéristiques plus courtes qui n'ont pas apporté de valeur ajoutée dans ce contexte particulier.
La Meilleure Approche : Intégration des Caractéristiques Verticales
On remarque que différentes catégories de produits réagissent de manière unique aux tendances du comportement des clients. Par exemple, les articles de Mode sont souvent influencés par les tendances actuelles, tandis que les produits alimentaires tendent à rester stables dans le temps.
Pour améliorer la performance du modèle combiné, on propose d'ajouter une couche de contexte de requête, spécifiquement à travers des caractéristiques verticales. Ces caractéristiques informent le modèle de classement sur la meilleure façon d'utiliser à la fois les caractéristiques comportementales à long et court terme pour différentes recherches de produits.
Le nouveau modèle, Modèle C, intègre ces caractéristiques verticales avec les deux types de données comportementales. Cela permet au modèle d'adapter son utilisation des caractéristiques en fonction du contexte spécifique de l'achat.
Tester le Modèle Intégré
Pour évaluer la nouvelle approche, on réalise un dernier test A/B comparant le Modèle C avec le Modèle de Base. Ce test dure deux semaines et analyse des métriques clés liées à l'engagement et à la satisfaction des clients.
Les résultats révèlent une amélioration significative dans diverses métriques, confirmant que l'utilisation d'une combinaison de caractéristiques comportementales avec des insights spécifiques à la requête peut améliorer l'expérience d'achat globale. Notamment, cette approche aide aussi à résoudre les problèmes qui surviennent dans les situations de démarrage à froid lorsque de nouveaux produits sont ajoutés au catalogue.
Conclusion
Dans cette étude, on a introduit un modèle de classement de recherche qui combine efficacement les caractéristiques comportementales à long et court terme avec des informations spécifiques aux verticales. Ce modèle est conçu pour capturer l'engagement des clients sur différentes périodes tout en s'assurant que le système de classement est réactif aux besoins d'achat actuels.
Les tests approfondis montrent que le nouveau modèle intégré dépasse les configurations précédentes qui reposaient uniquement sur un type de caractéristique comportementale. Cette amélioration aide non seulement à mieux répondre aux besoins des clients, mais aussi à poser les bases pour de futures améliorations des systèmes de classement de recherche.
Travaux Futurs
À l'avenir, il y a des plans pour élargir la portée du modèle de recherche. Les futures itérations considéreront des fenêtres de temps supplémentaires - comme une semaine et un an - pour capturer une gamme plus large de motifs d'engagement des clients. De plus, l'équipe a l'intention d'introduire des signaux de niveau requête plus détaillés, ce qui permettra de mieux adapter les caractéristiques comportementales pour améliorer encore l'expérience client.
Titre: Long or Short or Both? An Exploration on Lookback Time Windows of Behavioral Features in Product Search Ranking
Résumé: Customer shopping behavioral features are core to product search ranking models in eCommerce. In this paper, we investigate the effect of lookback time windows when aggregating these features at the (query, product) level over history. By studying the pros and cons of using long and short time windows, we propose a novel approach to integrating these historical behavioral features of different time windows. In particular, we address the criticality of using query-level vertical signals in ranking models to effectively aggregate all information from different behavioral features. Anecdotal evidence for the proposed approach is also provided using live product search traffic on Walmart.com.
Auteurs: Qi Liu, Atul Singh, Jingbo Liu, Cun Mu, Zheng Yan, Jan Pedersen
Dernière mise à jour: 2024-09-25 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2409.17456
Source PDF: https://arxiv.org/pdf/2409.17456
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.