Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 情報検索

TPMを使ってビデオおすすめを改善する

新しいモデルが視聴時間の予測を向上させて、ユーザーのエンゲージメントを高めるよ。

― 1 分で読む


TPM:次のレベルの動画予TPM:次のレベルの動画予を大幅に向上させるよ。新しいモデルは、推薦とユーザーのやり取り
目次

近年、YouTubeやTikTokみたいなオンライン動画サービスがめっちゃ人気になってるよね。ユーザーが推奨動画を見てる時間、つまり視聴時間が、ユーザーのエンゲージメントを保つ重要な要素なんだ。ユーザーがコンテンツを見てる時間が長いほど、そのプラットフォームにもっと関与するようになるから、視聴時間を正確に予測するのが、推薦を改善してユーザー体験を向上させるために大事なんだ。

でも、視聴時間を予測するのにはいくつかの課題があるんだ。まず、視聴時間は連続的な値だけど、ユーザーの好みと関連する順序も持ってるってこと。つまり、モデルはユーザーが動画をどのくらい見るかを予測するだけじゃなくて、その予測の順位も考慮しなきゃいけない。次に、動画を見てる時のユーザーの行動は相互に関係してるから、ある動画を見た時間が次の動画の視聴時間にも影響を与えることがあるんだ。さらに、予測には不確実性があって、モデルがその推定に自信を持ってない場合もある。最後に、推薦システムのバイアスが予測を歪めて、効果的じゃない推薦に繋がることもあるよ。

これらの課題に対処するために、TPM(木構造進行回帰モデル)って新しいアプローチが開発されたんだ。このシステムは、視聴時間の順位、ユーザー行動の関係、予測の不確実性、バイアス修正を考慮して、視聴時間をもっと正確に予測することを目指してる。

視聴時間の重要性

視聴時間は、推薦システムのパフォーマンスを測るための重要な指標なんだ。視聴時間が高いほど、通常はユーザーのエンゲージメントが増えるよね。ユーザーがもっと推奨動画を見れば、プラットフォームに戻る可能性が高くなるから、視聴時間の予測を改善する方法を見つけるのはめっちゃ大事。

多くのモデルが視聴時間を予測することに注力してるけど、順序や条件付き関係みたいな重要な要素を見落としてることが多いんだ。たとえば、あるモデルがユーザーが5分間動画を見るって予測しても、もし5分見たらその動画を最後まで見終える可能性が高いことを認識できてないかもしれない。

視聴時間予測の課題

視聴時間の予測にはいくつかの重要な課題があるよ:

  1. 順序関係: 視聴時間はランダムな数字じゃなくて、特定の順序があるんだ。たとえば、モデルがある動画の視聴時間を10分、別のを5分と予測したとき、その順序を守ることがめちゃくちゃ大事だよ。これが将来の推薦に影響するからね。

  2. 条件依存: ユーザーの行動は相互に関連してるんだ。たとえば、動画の半分を見た人は、全編を見続ける可能性が高いんだ。動画にかける時間は依存関係があるから、この関係性を予測に組み込むのが重要だよ。

  3. 予測の不確実性: モデルはしばしば固定された値を出すけど、それがどれだけ確かなのかは示されないことが多いんだ。もしシステムがユーザーが動画を1時間見るって予測した場合、その予測にどれだけ自信があるかを知るのがめちゃくちゃ重要なんだ。高い不確実性は、悪い推薦に繋がることがあるから。

  4. バイアスの増幅: 多くの推薦システムは、人気のある動画や長い動画を好むバイアスに悩まされてるんだ。これらのバイアスが予測を歪めて、ユーザーにとってあまり効果的じゃない推薦に繋がることもあるよ。

TPMの導入

これらの課題を克服するために、TPMが視聴時間予測のためのフレームワークとして設計されたんだ。いくつかの要素を組み合わせて、もっと正確でユーザー中心のアプローチを提供するんだ。

フレームワーク設計

TPMフレームワークは木構造で動いていて、各ノードが視聴時間を予測するための意思決定ポイントを表してる。モデルは広い質問から始めて、各ノードの回答に基づいてより具体的な質問に絞っていくんだ。この意思決定の木構造は、視聴時間の順位性を考慮するためにすごく重要なんだ。

この構造内で、モデルは各決定からデータを集めて、予測を洗練させるんだ。これによって、視聴時間予測の順序を守りつつ、ユーザーが見るかもしれない動画同士の関係を考慮できるようになるんだ。

不確実性に対処

従来のモデルでは、予測は固定された値として扱われることが多いけど、TPMは視聴時間を変わる可能性のある変数として扱うことで、予測に不確実性を導入してるんだ。これによって、モデルが各予測にどれだけ自信があるのかを定量化できるようになって、推薦のアプローチがもっと堅牢になるんだ。

バイアス修正

バイアスの増幅に対処するために、TPMはバックドア調整方法を取り入れてるんだ。これによって、予測を歪めるかもしれない混乱要因を考慮できるようになるんだ。バイアスの背後にある要因を理解することで、モデルはより公平な推薦を提供して、視聴時間の精度を向上させることができるんだ。

評価とパフォーマンス

TPMはその性能を評価するために、オフラインとオンラインの実験で徹底的にテストされてるよ。

オフライン評価

オフラインのシナリオでは、TPMはWeighted Logistic Regression(WLR)やDuration-Deconfounded Quantile(D2Q)みたいな既存の方法と比較されたんだ。その結果、TPMがこれらの方法よりもかなり優れていることが示されて、視聴時間予測での効果が証明されたんだ。

オンライン実験

TPMはKuaishouみたいなプラットフォームで実際の文脈でもテストされたんだ。このオンライン実験では、TPMが累積視聴時間やユーザーインタラクションといったメトリクスで改善されたパフォーマンスを示したよ。システムはユーザーが本当に興味を持っている動画を推薦できたから、エンゲージメントが増えたんだ。

A/Bテストの結果、ユーザーはTPMモデルによる推薦に対して、従来の方法よりも好意的に反応したんだ。さらに、動画を早めにスキップしたり離れたりするユーザーからのネガティブフィードバックが大幅に減ったのも重要だよ。

結論

効果的な推薦システムへの需要が高まる中で、視聴時間予測の重要性はますます増してるんだ。TPMは、これらの予測がどのように行われるかにおいて重要な進歩を意味してるんだ。視聴時間の順序性を取り入れて、ユーザー行動の相互依存をモデル化し、予測の不確実性に対処し、バイアスを軽減することで、TPMは動画推薦を改善するための包括的なソリューションを提供してるんだ。

さらなるテストと開発を続けることで、TPMはさまざまなプラットフォームでコンテンツがどのように推薦されるかを一新する可能性を秘めてるんだ。ユーザーが選ぶ動画にもっと深く関与できるようになるから、オンライン動画の風景が進化し続ける中で、TPMのようなシステムがユーザー体験を向上させて、これらのプラットフォームでのエンゲージメントを持続させる重要な役割を果たすことになるんだ。

オリジナルソース

タイトル: Discrete Conditional Diffusion for Reranking in Recommendation

概要: Reranking plays a crucial role in modern multi-stage recommender systems by rearranging the initial ranking list to model interplay between items. Considering the inherent challenges of reranking such as combinatorial searching space, some previous studies have adopted the evaluator-generator paradigm, with a generator producing feasible sequences and a evaluator selecting the best one based on estimated listwise utility. Inspired by the remarkable success of diffusion generative models, this paper explores the potential of diffusion models for generating high-quality sequences in reranking. However, we argue that it is nontrivial to take diffusion models as the generator in the context of recommendation. Firstly, diffusion models primarily operate in continuous data space, differing from the discrete data space of item permutations. Secondly, the recommendation task is different from conventional generation tasks as the purpose of recommender systems is to fulfill user interests. Lastly, real-life recommender systems require efficiency, posing challenges for the inference of diffusion models. To overcome these challenges, we propose a novel Discrete Conditional Diffusion Reranking (DCDR) framework for recommendation. DCDR extends traditional diffusion models by introducing a discrete forward process with tractable posteriors, which adds noise to item sequences through step-wise discrete operations (e.g., swapping). Additionally, DCDR incorporates a conditional reverse process that generates item sequences conditioned on expected user responses. Extensive offline experiments conducted on public datasets demonstrate that DCDR outperforms state-of-the-art reranking methods. Furthermore, DCDR has been deployed in a real-world video app with over 300 million daily active users, significantly enhancing online recommendation quality.

著者: Xiao Lin, Xiaokai Chen, Chenyang Wang, Hantao Shu, Linfeng Song, Biao Li, Peng jiang

最終更新: 2023-08-14 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2308.06982

ソースPDF: https://arxiv.org/pdf/2308.06982

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事