TransActでユーザーエンゲージメントを向上させる
TransActはPinterestのレコメンデーションシステムを強化して、ユーザー体験を向上させるよ。
― 1 分で読む
目次
最近、インターネットが急速に成長して、コンテンツが溢れかえってるよね。これじゃユーザーが欲しいものを見つけるのが難しくなっちゃう。そんな中、ユーザーがこの膨大な情報を管理する手助けとして、レコメンデーションシステムが人気になってるんだ。これらのシステムは、製品、画像、動画、音楽などのさまざまな選択肢から、関連するアイテムを見つける手助けをしてくれるんだ。ビジネスは、カスタマイズされた提案を提供することで、ユーザーを引きつけて満足させることができるんだよ。
Pinterestの役割
Pinterestは、ユーザーが「ピン」を通じてコンテンツを共有したり発見したりできる大手ソーシャルメディアプラットフォームの一つだよ。数十億のピンがあって、Pinterestは4億以上のユーザーにインスピレーションを提供してる。ユーザーがPinterestを訪れると、彼らを引き込むようにデザインされたホームフィードページが見えるんだ。このホームフィードは、ユーザーの興味や活動に基づいてコンテンツを取得、順位付け、統合する三段階のレコメンデーションシステムで動いてるよ。
三段階のレコメンデーションシステム
取得: この段階では、Pinterestが数十億のピンをユーザーの興味やフォローしているボードに基づいて、管理可能な数に絞り込むんだ。
順位付け: 次に、ポイントごとの順位付けモデルが、ユーザーにとっての適切さに基づいてこれらの候補ピンを整理するんだ。
統合: 最後に、結果がビジネスのニーズに合わせて調整される統合レイヤーがあるんだ。
リアルタイムレコメンデーションの重要性
リアルタイムレコメンデーションは、ユーザー体験を向上させるために欠かせないんだ。最近のユーザーの行動を使って、システムがより正確な提案を提供できるから、ユーザーが関連するコンテンツを見つけやすくなる。ユーザーの行動が長いと、興味をより良く表現できるけど、処理要求が増えたりレイテンシーの問題が出たりすることもあるんだ。
逐次レコメンデーションの課題
伝統的な逐次レコメンデーション手法は、ユーザーの表現をバッチプロセスで学習するか、リアルタイムの行動だけに焦点を当てたりすることが多い。この二重アプローチは、応答性と正確さのバランスを取るという独自の課題を生み出すんだ。一部の既存の解決策は、ハッシングや最近傍探索などの技術を使って長いユーザーシーケンスを管理するけど、他は過去の行動をオフラインで生成された単一のユーザー表現に変換するんだ。
TransActの導入
これらの問題に対処するために、PinterestはTransActというハイブリッドランキングアプローチを開発したんだ。このモデルは、ユーザーのリアルタイムの行動を使って即時の好みを捉えつつ、長期的な行動も活用するんだ。両方の方法を統合することで、システムは最近のユーザー活動に対するタイムリーなフィードバックを提供しながら、全体的な興味も理解できるようになってるよ。
TransActの主な特徴
ハイブリッドモデル: リアルタイムのユーザーアクション信号と長期的なバッチ表現を組み合わせているんだ。
トランスフォーマーベースのアーキテクチャ: 短期ユーザーアクションを効果的にエンコードするために新しいトランスフォーマーモジュールを使っているよ。
早期融合: 推薦プロセスの初期段階でユーザーとアイテムの特徴を融合させてパフォーマンスを向上させるんだ。
ホームフィードランキングモデルのアーキテクチャ
ホームフィードランキングモデル、Pinnabilityは、ユーザー、ピン、コンテキスト信号などのさまざまな入力信号を利用するWide and Deep学習アーキテクチャを採用してる。このモデルは、ユーザーが候補ピンに対してクリック、再ピン、隠すなどのいくつかのアクションを行う可能性を予測するように訓練されてるんだ。
再訓練の重要性
レコメンデーションモデルの再訓練は重要で、時間が経つにつれて変化するユーザーの好みにシステムが適応できるからなんだ。モデルが定期的に更新されないと、そのパフォーマンスが悪化して、ユーザーのエンゲージメントが減っちゃうことがあるんだ。だから、Pinnabilityは効果を維持するために週に2回再訓練されるんだよ。
特徴のエンコーディングと処理
TransActモデルでは、リアルタイムのユーザーアクションは長さが変わるシーケンスとして扱われるんだ。パフォーマンスを最大化するために、システムは各ユーザーの最近の100アクションだけを考慮するんだ。もしユーザーのアクションが100未満なら、シーケンスはゼロでパディングされるんだ。各アクションの特徴には、タイムスタンプ、アクションタイプ、PinSageの埋め込みが含まれてるよ。
アクションタイプの分類
ユーザーアクションの異なるタイプには、関連性に応じた異なる重みがあるんだ。例えば、再ピンされたピンは、ただ見ただけのものよりも一般的に関連性が高いと見なされるんだ。モデルは、アクションタイプを低次元ベクトルに変換するためのトレーニング可能な埋め込みテーブルを使用して、重要性を判断するのを助けるんだよ。
TransActにおけるトランスフォーマーの役割
ユーザーアクションシーケンスから情報を集約するために、TransActはトランスフォーマーベースのアーキテクチャを利用しているんだ。このアーキテクチャは、入力シーケンスを処理してユーザーの好みをキャッチする複数のレイヤーを含んでるよ。特に、位置エンコーディングがテストされたけど、あまり効果がなかったんだ。
タイムウィンドウマスキング
リアルタイムアクションを使う際の課題の一つは、ユーザーの最近の活動に集中しすぎて、多様性の少ないレコメンデーションになるリスクがあるんだ。これを解決するために、モデルはトレーニング時にタイムウィンドウマスクを実装して、よりバラエティ豊かな提案を維持するのを助けるんだよ。
オンラインとオフラインの実験
ハイブリッドモデルの有効性を検証するために、広範なオフラインおよびオンライン実験が行われたんだ。
オフライン評価
オフラインデータセットは、Pinterestのユーザーインタラクションから得られたランダムなサンプルを表してる。このデータは、結果が歪む可能性のあるバイアスなくモデルのパフォーマンスを評価するのに重要なんだ。モデルのユーザーアクション予測のパフォーマンスを測るために、HIT@3などのさまざまな評価指標が使われたよ。
オンラインテスト
オンライン実験では、モデルの有効性をPinterestの実際のユーザートラフィックを使って評価したんだ。再ピンのボリューム(ユーザーエンゲージメントの重要な指標)や隠すボリューム(提案されたアイテムをどれだけユーザーが却下するかを測る)などの指標が密接に監視されたんだ。その結果、TransActの導入がユーザーエンゲージメントを大幅に改善したことがわかったよ。
課題への対処
実験を通じて、エンゲージメントの低下やレコメンデーションの多様性の減少などのさまざまな課題が浮上したんだ。これらの問題は、モデルの調整、GPUサービングの最適化、バッチサイズの再評価などで緩和されたんだ。
フィードバックループ
もう一つ興味深い点は、TransActモデルがユーザーの行動に影響を与え、フィードバックループを作り出したことだよ。ユーザーがシステムとインタラクションすることで、彼らの行動がモデルにさらなるデータを提供して、時間の経過とともにさらなる改善が生まれるんだ。
Homefeedを超えたTransActの適用
TransActモデルの多様性は、ホームフィードランキングだけにとどまらないんだ。関連ピンや検索ランキングシステムのコンテンツレコメンデーションなど、他のエリアでもその能力を発揮できるんだ。この適応性は、さまざまなアプリケーションでエンゲージメントを促進するモデルの可能性を強調してるよ。
結論
TransActは、特にリアルタイムインタラクションと長期的なユーザーの興味を扱う上で、現代のレコメンデーションシステムの課題に対処するためのダイナミックで効果的な解決策として機能しているんだ。リアルタイムデータとバッチ処理を組み合わせるハイブリッドアプローチは、Pinterestのようなプラットフォームでユーザー体験を向上させる革新的な方法を提供しているよ。モデルの進化が続けば、さらなる洞察や改善が期待できるだろうし、パーソナライズされたレコメンデーションの分野で貴重なツールになると思うんだ。
タイトル: TransAct: Transformer-based Realtime User Action Model for Recommendation at Pinterest
概要: Sequential models that encode user activity for next action prediction have become a popular design choice for building web-scale personalized recommendation systems. Traditional methods of sequential recommendation either utilize end-to-end learning on realtime user actions, or learn user representations separately in an offline batch-generated manner. This paper (1) presents Pinterest's ranking architecture for Homefeed, our personalized recommendation product and the largest engagement surface; (2) proposes TransAct, a sequential model that extracts users' short-term preferences from their realtime activities; (3) describes our hybrid approach to ranking, which combines end-to-end sequential modeling via TransAct with batch-generated user embeddings. The hybrid approach allows us to combine the advantages of responsiveness from learning directly on realtime user activity with the cost-effectiveness of batch user representations learned over a longer time period. We describe the results of ablation studies, the challenges we faced during productionization, and the outcome of an online A/B experiment, which validates the effectiveness of our hybrid ranking model. We further demonstrate the effectiveness of TransAct on other surfaces such as contextual recommendations and search. Our model has been deployed to production in Homefeed, Related Pins, Notifications, and Search at Pinterest.
著者: Xue Xia, Pong Eksombatchai, Nikil Pancha, Dhruvil Deven Badani, Po-Wei Wang, Neng Gu, Saurabh Vishwas Joshi, Nazanin Farahpour, Zhiyuan Zhang, Andrew Zhai
最終更新: 2023-05-31 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2306.00248
ソースPDF: https://arxiv.org/pdf/2306.00248
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://docs.google.com/document/d/1TmU1ZyFpjhmYInhKnev2s41J79MkaOg_0CBlf1ao43c/edit
- https://arxiv.org/abs/2205.13147
- https://pytorch.org/blog/introducing-nvfuser-a-deep-learning-compiler-for-pytorch/
- https://github.com/NVIDIA/cuCollections
- https://docs.google.com/document/d/1MLY1oYCo-PyFP-vWCYX3yH688G1K0NIWMjTUM37FR9I/edit
- https://developer.nvidia.com/blog/cuda-graphs/
- https://flink.apache.org/
- https://kafka.apache.org/
- https://docs.google.com/document/d/1Tv8gbaXLfh2elTA20rCn6t99qswB0B_9xRSK3CI5PHw/edit#heading=h.pjp5lpc31bzn
- https://docs.google.com/spreadsheets/d/1HjHALNRgX00wH_XB6I7wFuBYUZoNZr0rNzgSADIsUn8/edit#gid=0
- https://w.pinadmin.com/display/CONTENT/Interest+Taxonomy#InterestTaxonomy-Whatisit
- https://github.com/pinterest/transformer_user_action
- https://arxiv.org/pdf/1905.01997.pdf
- https://www.overleaf.com/project/6348af571c7b08d1b4af9acb
- https://dl.acm.org/ccs.cfm