新しいコンテンツのおすすめを改善する
新しいシステムは、プラットフォーム上の新しいコンテンツの可視性を高めることを目指してるよ。
― 1 分で読む
目次
レコメンデーションシステムは、いろんなプラットフォームが使ってるツールで、ユーザーの過去のやり取りをもとに動画や音楽のコンテンツを提案してくれるやつだよ。これらのシステムは、ユーザーが興味に合ったコンテンツを見つけやすくして、ブラウジング体験をもっと楽しく、効率的にしてくれるんだ。でも、これらのシステムは、過去のユーザーのやり取りから集めたデータに頼ることが多くて、バイアスが生じることもあるんだ。システムが主に人気のあるコンテンツや有名なコンテンツを勧めると、既に人気があるアイテムがさらに目立つ状況ができちゃう。これが、新しいコンテンツやあまり知られてないコンテンツが視認性を得るのが難しくなる、「コールドスタート問題」につながってるんだ。
コールドスタート問題
新しいコンテンツがプラットフォームにアップロードされると、最初はあんまりビューややり取りがないから、レコメンデーションシステムに認識されにくいんだ。この早期の露出がないと、どのユーザーが新しいコンテンツを楽しむかを判断するのが難しくて、結果的に視認性が低くなっちゃう。これ、特に新しいクリエイターとかあまり人気のないジャンルでよく見られるんだ。コールドスタート問題は、レコメンデーションプラットフォームで新しいコンテンツの成長を妨げるから、クリエイターも多様なコンテンツを求めるユーザーも心配してるんだよ。
改善の目標
私たちの主な目標は、確立されたコンテンツを優先する視認性のサイクルを打破することなんだ。質の高い新しいコンテンツが、それを評価してくれるユーザーに届くような、より健康的なレコメンデーションシステムを作りたいんだ。そのためには、新しいコンテンツに初期の露出を提供する必要があるんだ。新しいアップロードが見られるチャンスを増やすことで、ユーザーに提供するコンテンツのバラエティやリッチさを改善できると思うんだ。
カバレッジと関連性のバランス
新しいコンテンツを勧めるときは、カバレッジと関連性という2つの重要な要素のバランスを取らなきゃいけないんだ。カバレッジは、ユーザーに見せる新しいコンテンツのユニークな数を指し、関連性はその提案がどれだけユーザーの興味に合ってるかを測るんだ。多様なコンテンツを見せようとするシステムは、提示される内容の質や関連性を犠牲にすることもあるんだ。私たちは、ユーザー体験に影響を与えずに、カバレッジと関連性の両方を同時に改善することを目指してるんだ。
専用システムの設計
新しいコンテンツを管理するために、私たちは新しくてあまり知られていないアイテムに特化したマルチステージのレコメンデーションシステムを設計したんだ。このシステムには、いくつかのコンポーネントが含まれてるよ:
フレッシュコンテンツノミネーター:これは、推薦する潜在的な新しいコンテンツを特定するんだ。新しいコンテンツにはユーザーのやり取りデータがないから、コンテンツ自体の特徴を使うんだ。この特徴が、どのユーザーが新しいコンテンツを楽しむかを予測するのに役立つんだ。
グラデュエーションフィルター:新しいコンテンツが十分な初期のやり取りを得たら、フレッシュコンテンツ専用のスロットから外れるんだ。代わりに、より広いレコメンデーションシステムに入ることができるようになる。このフィルターは、まだ露出が必要なコンテンツにリソースを向けるのを助けるんだ。
ランキングシステム:これは、推薦されたコンテンツを評価して、ユーザーに最適なオプションを見せることを確認するんだ。過去のユーザーのやり取りを使って、コンテンツのランキングや表示を洗練させるんだ。
ユーザーフィードバックの理解
ユーザーが新しいコンテンツに対してアクションを起こすと、そのフィードバックはとても貴重なんだ。このシステムは、そういったやり取りデータに迅速に適応できる必要があるから、リアルタイムの学習モデルを開発したんだ。このモデルは即座のフィードバックを利用して、どのコンテンツを見せるかを調整するから、推薦が関連性があって魅力的に保たれるんだ。
それを実現するために、2つの主な戦略を使ってるよ:
コンテンツ一般化:この方法は、新しいコンテンツの特徴に焦点を当てて、過去のユーザーのやり取りに頼るんじゃなくて、コンテンツの特徴を使うんだ。こうすることで、歴史的データが不足しても、システムはより良い推薦ができるんだ。
リアルタイム学習:これにより、システムは最近のユーザーのやり取りに基づいて適応できるんだ。フィードバックが推薦に影響を与えるのにかかる時間を最小限にすることで、ユーザーには現在の興味を反映したコンテンツが表示されるんだ。
コンテンツとユーザーのグルーピング
すべてのユーザーがプラットフォーム上で同じように行動するわけじゃないことを認識するのは大事なんだ。一部のユーザーはプラットフォームと定期的に関わるけど、他のユーザーはたまにしか訪れないかもしれない。私たちのシステムは、ユーザーの活動レベルに基づいてカテゴライズできるから、カスタマイズされた推薦ができるんだ。ユーザーの行動を理解することで、システムは新しいコンテンツを見せることとユーザーの満足度をうまくバランスさせられるんだ。
コンテンツプロバイダーとのコラボレーション
私たちのシステムの重要な側面は、クリエイターがもっとアップロードすることを促すことなんだ。クリエイターが新しいコンテンツが公平に露出されることを知っていれば、貢献してくれる可能性が高いんだ。これにより、多様なコンテンツが繁栄する生態系が生まれて、クリエイターとユーザーの両方に利益をもたらすことができるんだ。
影響の評価
専用のレコメンデーションシステムがどれだけ効果的かを測るために、いろんな指標を見てるよ。これには:
- デイリーユニークインプレスコンテンツ:これは、毎日ユーザーに表示される新しいコンテンツの異なる数を測るんだ。
- ユーザードウェルタイム:これは、ユーザーが推薦された新しいコンテンツにどれだけ長く関与するかを評価するんだ。長いドウェルタイムは、ユーザーがそのコンテンツを興味深いと感じてることを示すんだ。
- ディスカバラブルコーパス:この指標は、推薦された後にポジティブなやり取りを得る新しいアップロードの数を追跡するんだ。
これらの指標を分析することで、新しいコンテンツの推薦の成功とそれがユーザー体験に与える影響を判断できるんだ。
実験の実施
私たちのシステムがうまく機能しているかを確認するために、大規模な実験を行って、ユーザーのやり取りやフィードバックを密に監視してるんだ。こんなふうにして、レコメンデーションプロセスを微調整して、全体的なユーザー体験に悪影響を及ぼさずに、新しいコンテンツの視認性を向上させることを目指してるんだ。
結論
新しいコンテンツに対する公平で魅力的なレコメンデーションシステムを作るのは、今日のデジタル環境でめっちゃ重要なんだ。コールドスタート問題を認識して、カバレッジと関連性の両方に焦点を当てた専用のシステムを実装することで、ユーザー体験を改善できるし、クリエイターにとっても健康的なプラットフォームを育むことができるんだ。ユーザーフィードバックに基づいて継続的にモニタリングして適応することで、システムは反応的で効果的なままで、新しいコンテンツをユーザーの興味にぴったり合ったものとして発見できるようにするんだ。
要するに、適切なアプローチがあれば、視認性のバイアスのサイクルを打破して、新しいコンテンツが正当に注目される場所を手に入れることができるんだ。
タイトル: Fresh Content Needs More Attention: Multi-funnel Fresh Content Recommendation
概要: Recommendation system serves as a conduit connecting users to an incredibly large, diverse and ever growing collection of contents. In practice, missing information on fresh (and tail) contents needs to be filled in order for them to be exposed and discovered by their audience. We here share our success stories in building a dedicated fresh content recommendation stack on a large commercial platform. To nominate fresh contents, we built a multi-funnel nomination system that combines (i) a two-tower model with strong generalization power for coverage, and (ii) a sequence model with near real-time update on user feedback for relevance. The multi-funnel setup effectively balances between coverage and relevance. An in-depth study uncovers the relationship between user activity level and their proximity toward fresh contents, which further motivates a contextual multi-funnel setup. Nominated fresh candidates are then scored and ranked by systems considering prediction uncertainty to further bootstrap content with less exposure. We evaluate the benefits of the dedicated fresh content recommendation stack, and the multi-funnel nomination system in particular, through user corpus co-diverted live experiments. We conduct multiple rounds of live experiments on a commercial platform serving billion of users demonstrating efficacy of our proposed methods.
著者: Jianling Wang, Haokai Lu, Sai zhang, Bart Locanthi, Haoting Wang, Dylan Greaves, Benjamin Lipshitz, Sriraj Badam, Ed H. Chi, Cristos Goodrow, Su-Lin Wu, Lexi Baugher, Minmin Chen
最終更新: 2023-06-02 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2306.01720
ソースPDF: https://arxiv.org/pdf/2306.01720
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://www.overleaf.com/read/zzzfqvkmrfzn
- https://dl.acm.org/ccs.cfm
- https://screenshot.googleplex.com/76TpKVGcmuX2bNW
- https://screenshot.googleplex.com/5cXJqeHJhz8ZJdd
- https://screenshot.googleplex.com/8PAQqqjBkeF5zrU
- https://screenshot.googleplex.com/9RptDQGm88SkXhv
- https://screenshot.googleplex.com/C4hmDFXj8Paud2z
- https://screenshot.googleplex.com/ADvsUppQEiX8Mn8