Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations

Nouveau cadre pour prédire le temps de visionnage des vidéos

Un modèle améliore comment les plateformes recommandent des vidéos aux utilisateurs.

― 7 min lire


Amélioration desAmélioration desprévisions de temps devisionnagerecommandations de vidéos.Nouveau modèle améliore les
Table des matières

Dans le monde des plateformes de vidéos en ligne, prédire combien de temps un utilisateur va regarder une vidéo est super important pour garder les spectateurs engagés. On appelle ça la prédiction du temps de visionnage. Plus les gens regardent longtemps, plus ils sont susceptibles de rester sur la plateforme et de revenir en chercher plus. Avec ça en tête, les chercheurs bossent pour créer de meilleurs systèmes de prédiction du temps de visionnage pour améliorer les recommandations.

Importance de la Prédiction du Temps de Visionnage

Le temps de visionnage est un indicateur clé de l'engagement des utilisateurs. Quand une plateforme recommande des vidéos que les utilisateurs trouvent intéressantes et plaisantes, ils ont tendance à passer plus de temps à regarder. Ça profite non seulement aux utilisateurs, qui reçoivent un meilleur contenu, mais ça aide aussi la plateforme à augmenter ses utilisateurs actifs quotidiens et son succès global.

Malgré son importance, prédire le temps de visionnage a ses défis. Ce n'est pas juste deviner un chiffre ; il y a plein de facteurs qui peuvent influencer combien de temps quelqu'un va rester pour regarder une vidéo.

Principaux Défis de la Prédiction du Temps de Visionnage

  1. Nature Ordinale du Temps de Visionnage : Le temps de visionnage n'est pas qu'un chiffre. Il a un ordre spécifique qui reflète les préférences des utilisateurs. Si une vidéo a un temps de visionnage de 20 minutes, et une autre de 10 minutes, ça veut dire que les gens préfèrent la première vidéo. Un bon système de prédiction doit capturer cet ordre.

  2. Dépendance conditionnelle : Les gens regardent souvent les vidéos d'une certaine manière. Par exemple, pour finir une vidéo, un spectateur doit généralement en regarder une partie significative d'abord. Ce comportement doit être pris en compte dans le modèle de temps de visionnage pour que les prédictions soient précises.

  3. Conscience de l'Incertitude : Les prédictions peuvent être incertaines. Si un modèle prédit un temps de visionnage de 15 minutes, il peut avoir des doutes sur ce chiffre. Un bon système doit pouvoir prendre cette incertitude en compte, ce qui aide à faire de meilleures recommandations.

  4. Amplification de Biais : Beaucoup de systèmes de recommandation peuvent, sans le vouloir, favoriser certains types de vidéos, ce qui entraîne des recommandations biaisées. Par exemple, des vidéos populaires peuvent attirer plus d'attention, ce qui fausse les recommandations. Un bon modèle devrait reconnaître et minimiser ces biais.

Présentation du Modèle Progressif Basé sur les Arbres (TPM)

Pour relever ces défis, un nouveau cadre appelé le Modèle Progressif Basé sur les Arbres (TPM) a été développé. Cette approche vise à améliorer les prédictions de temps de visionnage en tenant compte des quatre défis clés mentionnés plus haut.

Comment Ça Marche, le TPM ?

Le TPM organise les prédictions de temps de visionnage dans une structure d'arbre. Chaque nœud de l'arbre représente une décision qui aide à déterminer le rang ordinal du temps de visionnage. Cette méthode permet une décomposition détaillée du processus de prédiction, rendant le tout plus efficace pour gérer les complexités du comportement des utilisateurs.

Rangs Ordinaux

La première étape du TPM consiste à catégoriser les temps de visionnage en différents rangs ordinaux. Ça veut dire qu'au lieu de traiter le temps de visionnage comme une seule prédiction numérique, on le divise en gammes. Par exemple, une vidéo pourrait entrer dans des catégories comme "temps de visionnage faible", "temps de visionnage moyen" ou "temps de visionnage élevé". En catégorisant ces prédictions, le TPM peut mieux refléter les préférences des utilisateurs.

Tâches Dépendantes Conditionnelles

Dans cette structure d'arbre, chaque point de décision est lié au point précédent. Ça rend les prédictions interdépendantes, permettant au modèle de prendre en compte comment les spectateurs regardent généralement les vidéos. Par exemple, si un spectateur a tendance à regarder la moitié d'une vidéo recommandée avant de décider de la finir, ce comportement peut être modélisé dans le système de prédiction.

Incertitude dans les Prédictions

Le TPM reconnaît que les prédictions peuvent venir avec de l'incertitude. En mesurant cette incertitude, le modèle peut avoir plus de confiance dans ses prédictions. Quand le modèle prédit un temps de visionnage, il va aussi considérer à quel point il "croit" à cette prédiction. Ça aide à fournir des recommandations plus fiables.

Lutte Contre les Biais

Le TPM intègre des mécanismes pour minimiser les biais dans les recommandations. En utilisant une technique connue sous le nom d'ajustement par backdoor, le TPM peut contrôler les facteurs qui mènent souvent à des résultats biaisés. Ça assure que le système fonctionne équitablement, donnant à toutes les vidéos une chance égale d'être recommandées, pas juste aux populaires.

Résultats de l'Utilisation du TPM

Le TPM a montré des résultats prometteurs tant dans des tests hors ligne que dans des applications réelles. Lorsqu'on l'a testé contre d'autres méthodes, le TPM a constamment surperformé en termes de précision prédictive. Ça veut dire que les utilisateurs ont reçu de meilleures recommandations vidéo basées sur leurs préférences.

Dans des études récentes, le TPM a été testé en utilisant des ensembles de données de plateformes vidéo. Les résultats ont montré une amélioration significative dans la prédiction du temps de visionnage par rapport aux méthodes existantes. Le système a pu mieux capturer les préférences des utilisateurs et améliorer l'engagement sur les plateformes vidéo.

Évaluations Hors Ligne

Dans des tests hors ligne, le TPM a été comparé à plusieurs autres méthodes de prédiction du temps de visionnage. Ces comparaisons ont illustré à quel point le TPM gère bien les défis de la prédiction du temps de visionnage. Il a été capable de gérer efficacement les relations ordinales du temps de visionnage, le rendant plus fiable que ses concurrents.

Expériences en Ligne

Le TPM a aussi été mis en œuvre dans une app vidéo réelle. Pendant les tests en ligne, le modèle a pu capturer des prédictions de temps de visionnage plus précises, menant à une amélioration notable de l'engagement des utilisateurs. Les utilisateurs étaient plus susceptibles de réagir positivement aux recommandations faites par le modèle TPM, résultant en expériences de visionnage améliorées.

Conclusion

Le Modèle Progressif Basé sur les Arbres offre une approche innovante pour prédire le temps de visionnage dans les systèmes de recommandation vidéo. En s'attaquant à des défis clés comme les relations ordinales, les dépendances conditionnelles, l'incertitude des prédictions et l'Amplification des biais, le TPM fournit une manière plus efficace et équitable de suggérer du contenu aux utilisateurs.

À mesure que le paysage numérique continue d'évoluer, améliorer les algorithmes qui conduisent les recommandations sera crucial pour maintenir l'engagement et la satisfaction des utilisateurs. Avec des résultats prometteurs tant des évaluations hors ligne qu'en ligne, le TPM représente une avancée significative dans le domaine des recommandations vidéo.

En résumé, le design unique et les capacités du TPM offrent une solution robuste pour prédire efficacement le temps de visionnage. Ça profite non seulement aux plateformes en améliorant l'expérience utilisateur, mais ça soutient aussi la croissance de la consommation de vidéos dans l'espace en ligne compétitif.

Source originale

Titre: Tree based Progressive Regression Model for Watch-Time Prediction in Short-video Recommendation

Résumé: An accurate prediction of watch time has been of vital importance to enhance user engagement in video recommender systems. To achieve this, there are four properties that a watch time prediction framework should satisfy: first, despite its continuous value, watch time is also an ordinal variable and the relative ordering between its values reflects the differences in user preferences. Therefore the ordinal relations should be reflected in watch time predictions. Second, the conditional dependence between the video-watching behaviors should be captured in the model. For instance, one has to watch half of the video before he/she finishes watching the whole video. Third, modeling watch time with a point estimation ignores the fact that models might give results with high uncertainty and this could cause bad cases in recommender systems. Therefore the framework should be aware of prediction uncertainty. Forth, the real-life recommender systems suffer from severe bias amplifications thus an estimation without bias amplification is expected. Therefore we propose TPM for watch time prediction. Specifically, the ordinal ranks of watch time are introduced into TPM and the problem is decomposed into a series of conditional dependent classification tasks which are organized into a tree structure. The expectation of watch time can be generated by traversing the tree and the variance of watch time predictions is explicitly introduced into the objective function as a measurement for uncertainty. Moreover, we illustrate that backdoor adjustment can be seamlessly incorporated into TPM, which alleviates bias amplifications. Extensive offline evaluations have been conducted in public datasets and TPM have been deployed in a real-world video app Kuaishou with over 300 million DAUs. The results indicate that TPM outperforms state-of-the-art approaches and indeed improves video consumption significantly.

Auteurs: Xiao Lin, Xiaokai Chen, Linfeng Song, Jingwei Liu, Biao Li, Peng Jiang

Dernière mise à jour: 2023-06-06 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2306.03392

Source PDF: https://arxiv.org/pdf/2306.03392

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires