S'attaquer au biais de durée dans les recommandations vidéo
Un nouveau modèle améliore les prédictions d'intérêt des utilisateurs pour le contenu vidéo.
― 8 min lire
Table des matières
Les plateformes de contenu vidéo sont devenues une partie essentielle de notre quotidien, attirant des millions d'utilisateurs qui interagissent avec différents types de vidéos. Avec la montée de la demande pour du contenu personnalisé, il est crucial de développer des systèmes qui fournissent aux utilisateurs des recommandations vidéo pertinentes adaptées à leurs intérêts. L'un des moyens d'évaluer l'intérêt des utilisateurs pour les vidéos est le Temps de visionnage, c'est-à-dire la durée pendant laquelle les utilisateurs passent à regarder des vidéos particulières.
Cependant, prédire le temps de visionnage peut être trompeur à cause d'un phénomène connu sous le nom de biais de durée. Ce biais se produit lorsque la longueur de la vidéo influence le temps de visionnage, entraînant des réflexions inexactes sur l'intérêt des utilisateurs. Par exemple, les utilisateurs peuvent passer plus de temps à regarder des vidéos plus longues, non pas nécessairement parce qu'ils y sont plus intéressés, mais simplement parce qu'elles prennent plus de temps à regarder.
Pour créer de meilleures recommandations qui reflètent précisément les préférences des utilisateurs, il est vital de comprendre et de traiter ce biais de durée.
Le Problème du Biais de Durée
Le biais de durée nuit à l'efficacité des recommandations vidéo. Les méthodes actuelles qui tentent de corriger ce biais traitent souvent toutes les vidéos qui sont entièrement regardées comme des indicateurs d'un grand intérêt. Cependant, les données du monde réel montrent que l'engagement des utilisateurs varie considérablement même parmi les vidéos qui sont complètement regardées. Certains utilisateurs peuvent se sentir satisfaits avec des vidéos plus courtes tandis que d'autres peuvent se sentir insatisfaits, même si les deux groupes ont totalement regardé les vidéos. Cette divergence peut conduire à des hypothèses erronées sur l'intérêt des utilisateurs basées uniquement sur le temps de visionnage.
Pour illustrer cela, considérons deux utilisateurs qui regardent complètement la même vidéo. L'utilisateur A peut se sentir content après avoir regardé une vidéo de 30 secondes, tandis que l'utilisateur B peut estimer que cette même vidéo ne répondait pas pleinement à ses besoins. Si les deux sont traités de manière égale en termes d'intérêt juste parce qu'ils ont terminé la vidéo, le système de recommandation échoue à capturer leurs niveaux de satisfaction différents.
Temps de Visionnage Contrefactuel
Pour s'attaquer au problème du biais de durée, nous proposons un nouveau concept appelé temps de visionnage contrefactuel (TVC). Ce concept fait référence au temps de visionnage hypothétique que les utilisateurs auraient si la durée de la vidéo était suffisamment longue. En d'autres termes, le TVC représente le temps que les utilisateurs souhaiteraient idéalement passer sur une vidéo en fonction de leurs véritables intérêts, sans être limités par la durée réelle de la vidéo.
Le TVC aide à éclairer les préférences des utilisateurs car il considère la possibilité qu'un utilisateur puisse vouloir regarder plus longtemps qu'il ne l'a fait. Cela crée une compréhension plus nuancée de l'intérêt des utilisateurs, surtout pour les vidéos qui sont complètement regardées. L'idée est de tirer des enseignements sur les préférences des utilisateurs à partir du contexte du temps qu'ils passeraient à regarder si la vidéo était plus longue.
Modélisation du Temps de Visionnage Contrefactuel
Pour modéliser efficacement le TVC et estimer l'intérêt des utilisateurs, nous présentons une nouvelle approche appelée le Modèle de Temps de Visionnage Contrefactuel (MTVC). Cette approche traite le comportement de visionnage des utilisateurs d'une manière similaire à la prise de décision économique. Les utilisateurs pèsent essentiellement le plaisir qu'ils tirent de regarder une vidéo par rapport au coût de leur temps.
En gros, le modèle suppose que les utilisateurs continueront à regarder une vidéo jusqu'à ce que le plaisir tiré d'une vision prolongée ne soit plus supérieur au coût de ce temps. Le point auquel un utilisateur décide de cesser de regarder peut être compris comme son TVC.
De plus, nous introduisons une fonction de transformation qui convertit le TVC en une estimation de l'intérêt des utilisateurs. Cela nous permet de créer un score d'intérêt utilisateur basé sur leur temps de visionnage potentiel plutôt que simplement sur le temps qu'ils ont effectivement enregistré.
Preuves Soutenant le TVC
Le concept de TVC est soutenu par des observations issues de jeux de données de recommandations vidéo du monde réel. En examinant le comportement des utilisateurs, deux phénomènes notables émergent :
Visionnage Répété : Les utilisateurs jouent souvent des vidéos plusieurs fois, ce qui indique un niveau d'intérêt élevé. Cependant, cet engagement répété survient généralement lorsque les utilisateurs estiment que la vidéo ne répond pas complètement à leurs besoins, laissant entendre que leur TVC est tronqué.
Distribution Bimodale du Temps de Visionnage : En analysant la distribution des temps de visionnage pour la même vidéo, on peut souvent observer deux groupes distincts : les utilisateurs qui passent rapidement à travers la vidéo et ceux qui la regardent complètement. Cette distribution bimodale suggère que les temps de visionnage ne sont pas uniformément répartis, confirmant encore que les méthodes traditionnelles échouent à capturer la complexité de l'intérêt des utilisateurs.
En intégrant le TVC dans nos systèmes de recommandation, nous pouvons développer une compréhension plus claire des désirs et des intérêts des utilisateurs en matière de contenu vidéo.
Avantages du Modèle de Temps de Visionnage Contrefactuel
Le MTVC offre plusieurs avantages par rapport aux méthodes existantes visant à corriger le biais de durée. En déplaçant l'accent des temps de visionnage observés vers un modèle plus complet qui inclut les préférences des utilisateurs, le MTVC fournit une représentation plus précise de l'intérêt des utilisateurs.
L'un des principaux avantages de l'utilisation du MTVC est sa capacité à aligner les intérêts des utilisateurs plus étroitement avec leurs véritables préférences. Cela conduit à des recommandations améliorées qui correspondent mieux aux attentes des utilisateurs.
De plus, le MTVC permet l'estimation simultanée du temps de visionnage et de l'intérêt des utilisateurs. Les méthodes traditionnelles ont souvent du mal à atteindre cet objectif dual efficacement ; elles peuvent mettre l'accent sur l'un au détriment de l'autre. Cependant, en adoptant un cadre qui reflète vraiment l'engagement des utilisateurs, le MTVC garantit que les deux aspects sont respectés et capturés avec précision.
Succès Empirique
Pour valider notre approche, des expériences approfondies ont été menées à l'aide de jeux de données du monde réel. Ces expériences ont révélé que le MTVC surperformait les méthodes existantes, en particulier dans les scénarios où le biais de durée était le plus sévère.
Les résultats ont démontré une précision améliorée dans la prédiction du temps de visionnage et dans la fourniture de recommandations vidéo pertinentes basées sur l'intérêt des utilisateurs. Notamment, le MTVC a montré une performance remarquable même dans des ensembles de données avec un pourcentage élevé de vidéos entièrement regardées, où d'autres approches ont rencontré des difficultés.
De plus, des tests A/B en ligne ont confirmé les bénéfices pratiques du MTVC dans les recommandations en temps réel. Les utilisateurs ont signalé un temps de visionnage moyen plus élevé lorsque les recommandations étaient générées à l'aide du MTVC, indiquant une satisfaction utilisateur accrue.
Conclusion
En conclusion, le défi du biais de durée est significatif dans les systèmes de recommandation vidéo. En introduisant le concept de temps de visionnage contrefactuel et en développant le Modèle de Temps de Visionnage Contrefactuel, nous avons créé un cadre plus efficace pour comprendre et prédire les intérêts des utilisateurs.
Cette approche améliore non seulement l'exactitude des recommandations vidéo, mais entraîne également une plus grande satisfaction des utilisateurs en alignant le contenu plus étroitement avec leurs préférences. À mesure que la consommation de vidéos continue de croître, la mise en œuvre de modèles comme le MTVC sera essentielle pour garantir que les utilisateurs reçoivent un contenu pertinent et engageant adapté à leurs véritables intérêts.
Les résultats de nos expériences soulignent le potentiel du MTVC à transformer notre approche des recommandations vidéo. En nous concentrant sur les intérêts des utilisateurs de manière plus profonde, nous pouvons progresser vers la création de systèmes qui bénéficient à la fois aux utilisateurs et aux plateformes de contenu.
Titre: Counteracting Duration Bias in Video Recommendation via Counterfactual Watch Time
Résumé: In video recommendation, an ongoing effort is to satisfy users' personalized information needs by leveraging their logged watch time. However, watch time prediction suffers from duration bias, hindering its ability to reflect users' interests accurately. Existing label-correction approaches attempt to uncover user interests through grouping and normalizing observed watch time according to video duration. Although effective to some extent, we found that these approaches regard completely played records (i.e., a user watches the entire video) as equally high interest, which deviates from what we observed on real datasets: users have varied explicit feedback proportion when completely playing videos. In this paper, we introduce the counterfactual watch time(CWT), the potential watch time a user would spend on the video if its duration is sufficiently long. Analysis shows that the duration bias is caused by the truncation of CWT due to the video duration limitation, which usually occurs on those completely played records. Besides, a Counterfactual Watch Model (CWM) is proposed, revealing that CWT equals the time users get the maximum benefit from video recommender systems. Moreover, a cost-based transform function is defined to transform the CWT into the estimation of user interest, and the model can be learned by optimizing a counterfactual likelihood function defined over observed user watch times. Extensive experiments on three real video recommendation datasets and online A/B testing demonstrated that CWM effectively enhanced video recommendation accuracy and counteracted the duration bias.
Auteurs: Haiyuan Zhao, Guohao Cai, Jieming Zhu, Zhenhua Dong, Jun Xu, Ji-Rong Wen
Dernière mise à jour: 2024-06-13 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2406.07932
Source PDF: https://arxiv.org/pdf/2406.07932
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.