Améliorer la recherche e-commerce avec des ensembles modulaires
Une nouvelle approche améliore la pertinence de la recherche de produits dans le e-commerce en utilisant des modèles avancés.
― 8 min lire
Table des matières
- Le Problème de la Pertinence de Recherche
- Approches Précédentes
- L'Approche Proposée
- Composants Clés
- Éléments des Modèles
- Modèles Linguistiques
- Modèles Graphiques
- Ensemble Interprétable
- Expériences et Résultats
- Analyse de Performance
- Application Pratique
- Stratégie de Déploiement
- Implications pour le E-Commerce
- Conclusion
- Source originale
- Liens de référence
Le e-commerce a explosé, et les utilisateurs cherchent souvent des produits avec des termes courts et spécifiques. Ça peut rendre difficile pour les entreprises de montrer les produits les plus pertinents. Le principal défi est de comprendre ce que les utilisateurs veulent dire quand ils font une recherche et de faire le lien avec les bons produits. Les méthodes traditionnelles utilisent des modèles linguistiques pour piger le texte des requêtes des utilisateurs et des réseaux neuronaux graphiques pour étudier comment différents produits sont liés entre eux.
Les avancées récentes en technologie ont rendu plus compliqué pour les entreprises d’adopter rapidement de nouveaux modèles. Pour utiliser un nouveau modèle, les entreprises doivent le tester sur des données du monde réel, ce qui peut être difficile et coûteux. De plus, beaucoup de modèles actuels fonctionnent de manière pas très claire pour les gens. Ça rend dur de juger leur efficacité ou de comparer différents modèles.
Pour résoudre ces problèmes, une nouvelle approche appelée ensemble modulaire a été créée. Cette méthode utilise une collection de modèles qui peuvent travailler ensemble. L’idée est de permettre à différents types de modèles d’être utilisés ensemble facilement, avec des explications claires sur leur fonctionnement.
Le Problème de la Pertinence de Recherche
Quand les gens cherchent des produits, ils utilisent souvent des requêtes courtes et complexes. Ces requêtes peuvent avoir des significations différentes selon le contexte. Par exemple, quelqu'un qui cherche "chaussures de course" peut vouloir acheter des chaussures, en savoir plus ou même lire des avis. Comprendre cette intention est crucial.
Faire le lien entre les requêtes et les produits implique d’identifier la relation entre eux. Ça peut être exact, où le produit correspond parfaitement ; substitut, où un autre produit similaire est approprié ; complément, où un produit additionnel est nécessaire ; ou non pertinent, où le produit ne correspond pas du tout.
Cependant, ce n'est pas facile de rassembler assez de données étiquetées pour entraîner des modèles à cette fin. Beaucoup de modèles reposent sur des données de comportement utilisateur, qui ont tendance à être anonymes et agrégées. Ça complique l'obtention d'informations précises sur des requêtes et produits spécifiques.
Approches Précédentes
Au début, la pertinence de recherche se concentrait sur l'utilisation des mots dans les requêtes et les descriptions de produits. Avec le temps, les chercheurs ont réalisé qu'il était important de considérer comment les utilisateurs interagissent avec les produits. Ça inclut les clics, les achats et d'autres actions. Cependant, la plupart des méthodes échouent à expliquer comment elles arrivent à leurs conclusions, limitant leur efficacité dans des situations réelles.
De plus, les méthodes traditionnelles peuvent exiger que tous les modèles soient réentraînés chaque fois qu'il y a un changement dans les données. Ça peut être long et coûteux.
L'Approche Proposée
La nouvelle méthode combine des modèles linguistiques et des réseaux neuronaux graphiques dans un cadre modulaire. Ça permet une configuration flexible où différents modèles peuvent être ajoutés ou retirés selon les besoins. Le cadre peut décider automatiquement quels modèles et signaux utiliser en fonction de leur importance pour la tâche à accomplir.
Composants Clés
Traitement des données : La première étape implique de préparer les données en organisant efficacement les requêtes et les informations sur les produits.
Entraînement des Modèles : Cette partie consiste à alimenter les données préparées à différents modèles, qui apprennent à reconnaître des motifs et à faire des prédictions.
Sélection des Modèles : Une étape importante qui utilise une méthode appelée SHAP pour évaluer combien chaque modèle contribue aux prédictions globales. Les modèles qui n'apportent pas beaucoup peuvent être éliminés.
Inférence des Modèles : C'est ici que les modèles entraînés sont utilisés pour faire des prédictions sur de nouvelles données.
Éléments des Modèles
Dans cette approche, l'entrée consiste en des paires de requêtes et de produits. Chaque paire est analysée en utilisant divers signaux des interactions utilisateur. L'idée est d'apprendre à classer ces paires dans les classes de pertinence définies (exact, substitut, complément, non pertinent).
Modèles Linguistiques
Pour cette approche, plusieurs modèles linguistiques sont utilisés pour analyser le texte des requêtes et des produits. Ces modèles aident à comprendre le contexte et le sens du texte, permettant un meilleur appariement avec les produits.
Modèles Graphiques
Les modèles graphiques sont cruciaux car ils aident à comprendre les connexions entre différents produits basés sur le comportement utilisateur. En utilisant des graphes, le modèle peut apprendre comment différents produits sont liés entre eux, aidant à sélectionner les éléments les plus pertinents pour une requête.
Ensemble Interprétable
La combinaison de ces modèles se fait par une méthode appelée Arbres de Décision à Gradient (GBDT). Les GBDT améliorent la précision des prédictions en combinant les résultats de plusieurs arbres de décision de manière encore interprétable.
Ça signifie qu'il est possible de comprendre comment les modèles individuels et les caractéristiques contribuent à la décision finale.
Expériences et Résultats
L'approche a été testée sur un jeu de données du monde réel composé de millions de paires requête-produit. Le jeu de données incluait divers signaux de comportement et a été collecté dans plusieurs régions, assurant une diversité dans les données.
Analyse de Performance
Le nouveau modèle a été comparé à des modèles de base existants en termes de précision et de scores F1. Les résultats ont montré que le modèle proposé surpassait les autres, non seulement en précision de prédiction mais aussi en capacité à expliquer ses décisions.
Par exemple, on a constaté que les modèles linguistiques performaient généralement mieux que les modèles graphiques pour capturer la signification sémantique des requêtes et des produits. Ça souligne l'importance de comprendre le langage que les utilisateurs emploient dans leurs recherches.
Application Pratique
Ce modèle est conçu avec une utilisation pratique en tête. Il peut facilement s'intégrer dans les systèmes de e-commerce existants, aidant à améliorer les résultats de recherche pour les utilisateurs.
Stratégie de Déploiement
Après l’entraînement, les modèles peuvent être stockés et chargés rapidement pour l'inférence. Ça garantit que quand les utilisateurs cherchent des produits, le système peut répondre presque instantanément. L'approche permet aussi des mises à jour régulières pour garder le modèle frais et pertinent.
En pratique, l'impact de ce nouveau modèle sur les moteurs de recherche peut améliorer considérablement la façon dont les produits sont classés en fonction des requêtes des utilisateurs. Ça peut réduire les biais et fournir des explications plus claires pour les recommandations de produits, améliorant ainsi l'expérience utilisateur.
Implications pour le E-Commerce
Dans le monde rapide du e-commerce, pouvoir fournir des résultats précis et compréhensibles est vital. Le nouveau modèle peut aider les entreprises à mieux répondre aux besoins de leurs clients, ce qui entraîne finalement une augmentation de la confiance et de la satisfaction.
Conclusion
L'ensemble modulaire de modèles linguistiques et de réseaux neuronaux graphiques représente un pas en avant significatif dans l'amélioration de la pertinence de recherche dans le e-commerce. L'approche améliore non seulement la précision et la vitesse, mais améliore également l'interprétabilité des résultats, ce qui est crucial pour déployer des systèmes efficaces dans des applications réelles.
En se concentrant sur la combinaison de la compréhension linguistique et du comportement utilisateur, cette méthode offre une solution robuste aux défis rencontrés dans les recherches de produits modernes en e-commerce.
Grâce à la recherche et au développement continus, d'autres avancées peuvent être réalisées pour s'assurer que ce cadre reste actuel et efficace dans un marché en constante évolution.
Titre: An Interpretable Ensemble of Graph and Language Models for Improving Search Relevance in E-Commerce
Résumé: The problem of search relevance in the E-commerce domain is a challenging one since it involves understanding the intent of a user's short nuanced query and matching it with the appropriate products in the catalog. This problem has traditionally been addressed using language models (LMs) and graph neural networks (GNNs) to capture semantic and inter-product behavior signals, respectively. However, the rapid development of new architectures has created a gap between research and the practical adoption of these techniques. Evaluating the generalizability of these models for deployment requires extensive experimentation on complex, real-world datasets, which can be non-trivial and expensive. Furthermore, such models often operate on latent space representations that are incomprehensible to humans, making it difficult to evaluate and compare the effectiveness of different models. This lack of interpretability hinders the development and adoption of new techniques in the field. To bridge this gap, we propose Plug and Play Graph LAnguage Model (PP-GLAM), an explainable ensemble of plug and play models. Our approach uses a modular framework with uniform data processing pipelines. It employs additive explanation metrics to independently decide whether to include (i) language model candidates, (ii) GNN model candidates, and (iii) inter-product behavioral signals. For the task of search relevance, we show that PP-GLAM outperforms several state-of-the-art baselines as well as a proprietary model on real-world multilingual, multi-regional e-commerce datasets. To promote better model comprehensibility and adoption, we also provide an analysis of the explainability and computational complexity of our model. We also provide the public codebase and provide a deployment strategy for practical implementation.
Auteurs: Nurendra Choudhary, Edward W Huang, Karthik Subbian, Chandan K. Reddy
Dernière mise à jour: 2024-03-01 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2403.00923
Source PDF: https://arxiv.org/pdf/2403.00923
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.