Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations

Estimation du biais de position dans la publicité en ligne

Une nouvelle approche améliore l'estimation du biais de position en utilisant des embeddings d'articles.

― 6 min lire


Percée dans l'estimationPercée dans l'estimationdu biais de positionpublicité en ligne.rareté des données dans l'analyse de laDe nouvelles méthodes s'attaquent à la
Table des matières

La publicité en ligne est super importante pour le e-commerce, où l'emplacement des annonces peut vraiment influencer le nombre de clics qu'elles reçoivent. Quand les utilisateurs voient des pubs, leurs positions peuvent les pousser à cliquer sur certaines plus que sur d'autres. Cette tendance s'appelle le Biais de position. Comprendre et évaluer ce biais est important pour améliorer l'efficacité des annonces. Mais c'est pas toujours évident, surtout quand les données sont limitées.

Le Défi de l'Estimation du Biais de Position

Le biais de position se manifeste quand on regarde combien de fois les utilisateurs cliquent sur des annonces selon leur position. Par exemple, en général, les gens ont plus tendance à cliquer sur les pubs en haut d'une page web que sur celles plus bas. Ce comportement peut mener à des conclusions trompeuses si on ne gère pas ça correctement. Les données de clics recueillies auprès des utilisateurs incluent souvent ce biais, donc c'est important de trouver des moyens de l'estimer avec précision.

Dans beaucoup de scénarios publicitaires, l'ordre et la position des annonces sont déjà fixés, ce qui fait qu'on a des combinaisons limitées d'objets et de positions dans les données collectées. Cette contrainte mène à un ensemble de données sparse, où certaines combinaisons d'objets et de positions n'apparaissent même pas. Du coup, estimer le biais de position avec précision devient plus compliqué.

Méthodes Actuelles

Il existe plusieurs méthodes pour estimer le biais de position. Une approche utilise un modèle statistique qui nécessite une variété de données pour fonctionner efficacement. Cependant, dans la publicité réelle, les marketeurs affichent souvent les annonces dans un ordre fixe, ce qui réduit la diversité des données disponibles pour cette estimation. En conséquence, beaucoup de ces méthodes peuvent ne pas donner des estimations fiables quand on doit gérer des ensembles de données spars.

D'autres modèles ont été proposés pour mieux estimer le biais de position, y compris ceux qui utilisent des techniques de randomisation. Ces modèles cherchent à créer des données plus équilibrées en changeant les positions des annonces. Néanmoins, ça peut être coûteux et pas toujours pratique dans le monde réel.

Solution Proposée

Pour s'attaquer au problème de la rareté des données, une nouvelle approche a été proposée, qui intègre des embeddings d'objets. Les embeddings d'objets consistent à représenter les items d'une manière qui capture leurs similitudes. En créant des représentations des items qui reflètent à quel point ils se ressemblent, on peut estimer les valeurs manquantes dans les données de position.

Cette nouvelle méthode se concentre sur l'utilisation des similitudes connues entre les items pour prédire les clics dans les positions où aucune donnée n'a été collectée. Par exemple, si deux items sont similaires, les infos sur un item peuvent aider à estimer les clics attendus pour l'autre dans différentes positions.

L'Importance des Embeddings d'Objets

Les embeddings d'objets sont importants parce qu'ils offrent un moyen de relier les données des items quand des appariements spécifiques d'items et de positions manquent. Cette connexion permet d'estimer le biais de position de manière plus précise. La méthode proposée utilise des techniques populaires comme l'Indexation sémantique latente (LSI) et les Autoencodeurs Variationnels (VAE) pour créer ces embeddings d'objets.

L'objectif est de combler les lacunes dans les données. En estimant à quoi ressembleraient les patterns de clics pour des items dans des positions où aucun clic n'est observé, on peut renforcer la base pour estimer le biais de position.

Expériences et Résultats

Pour évaluer l'efficacité de la nouvelle approche, des expériences approfondies ont été menées sur deux ensembles de données. Un ensemble est public et contient une énorme quantité de données d'interaction des utilisateurs, tandis que l'autre provient d'une plateforme de e-commerce bien connue.

Les expériences ont évalué à quel point la méthode proposée pouvait estimer le biais de position dans des ensembles de données spars. Dans un test, la nouvelle méthode a été comparée aux approches traditionnelles. Les résultats ont montré que l'utilisation des embeddings d'objets améliorait l'exactitude des estimations du biais de position. En particulier, LSI a surpassé VAE en termes de précision, ce qui indique la valeur d'utiliser ces embeddings pour l'estimation du biais de position.

D'autres évaluations ont aussi examiné comment la méthode pouvait améliorer les recommandations de classement. En appliquant les valeurs de biais de position apprises lors des expériences, les chercheurs ont analysé les impacts sur l'efficacité avec laquelle les items étaient classés et suggérés aux utilisateurs. Les résultats ont indiqué des améliorations notables dans la performance des recommandations grâce aux estimations plus précises du biais de position.

Conclusion

Le domaine de l'estimation du biais de position a rencontré des défis, surtout avec des ensembles de données spars. Cependant, les méthodes innovantes qui intègrent des embeddings d'objets offrent une solution efficace. En se concentrant sur les similarités entre les items, l'approche proposée est capable de surmonter les limites en matière de disponibilité des données.

Cela signifie que cette recherche ne fait pas qu'apporter des insights précieux sur comment estimer le biais de position plus efficacement, mais elle améliore aussi la performance globale des systèmes de recommandation dans le e-commerce. Les implications d'une meilleure compréhension du biais de position sont significatives, conduisant à des stratégies de placement d'annonces améliorées et au final à une meilleure expérience utilisateur en ligne.

Directions Futures

Il y a plein de pistes à explorer pour le futur dans ce domaine. Une direction potentielle serait d'enquêter sur d'autres méthodes pour créer des embeddings d'objets qui améliorent encore l'estimation du biais de position. De plus, expérimenter avec différents types d'ensembles de données pourrait offrir des insights et des améliorations encore plus larges.

En plus, intégrer des facteurs comme la démographie des utilisateurs, leurs comportements et des éléments temporels dans l'analyse pourrait mener à une compréhension plus globale de comment le biais de position affecte les interactions des utilisateurs avec les annonces. Explorer des applications interdomaines de cette méthode pourrait aussi apporter de la valeur dans différentes industries où la publicité en ligne est répandue.

En somme, alors que le e-commerce continue de grandir, améliorer les techniques pour estimer le biais de position sera essentiel pour optimiser les publicités et améliorer l'expérience utilisateur. Les résultats de cette recherche ouvrent la voie vers des stratégies publicitaires plus précises et efficaces dans un paysage digital de plus en plus concurrentiel.

Source originale

Titre: Position Bias Estimation with Item Embedding for Sparse Dataset

Résumé: Estimating position bias is a well-known challenge in Learning to Rank (L2R). Click data in e-commerce applications, such as targeted advertisements and search engines, provides implicit but abundant feedback to improve personalized rankings. However, click data inherently includes various biases like position bias. Based on the position-based click model, Result Randomization and Regression Expectation-Maximization algorithm (REM) have been proposed to estimate position bias, but they require various paired observations of (item, position). In real-world scenarios of advertising, marketers frequently display advertisements in a fixed pre-determined order, which creates difficulties in estimation due to the limited availability of various pairs in the training data, resulting in a sparse dataset. We propose a variant of the REM that utilizes item embeddings to alleviate the sparsity of (item, position). Using a public dataset and internal carousel advertisement click dataset, we empirically show that item embedding with Latent Semantic Indexing (LSI) and Variational Auto-Encoder (VAE) improves the accuracy of position bias estimation and the estimated position bias enhances Learning to Rank performance. We also show that LSI is more effective as an embedding creation method for position bias estimation.

Auteurs: Shion Ishikawa, Yun Ching Liu, Young-Joo Chung, Yu Hirate

Dernière mise à jour: 2024-03-11 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2305.13931

Source PDF: https://arxiv.org/pdf/2305.13931

Licence: https://creativecommons.org/publicdomain/zero/1.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires