Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 情報検索# 人工知能# 機械学習

パーソナライズされたフィードでECを改善する

この方法は、動的なパーソナライズされたおすすめを通じてユーザーのエンゲージメントを高めるよ。

― 1 分で読む


次世代パーソナライズドEコ次世代パーソナライズドEコマースを高めるよ。ングでのエンゲージメントとコンバージョンダイナミックフィードはオンラインショッピ
目次

パーソナライズされたフィードは、eコマースプラットフォームにとって必需品になってきてるね。これによって、顧客は欲しい商品をすぐに見つけられる。人気の選択肢の一つが埋め込みを使うことで、これは機械が理解できる形式でアクションやアイテムを表現する方法なんだ。埋め込みを使うことで、システムは似たアイテムを見つけてユーザーに提案できる。この論文では、パーソナライズされたフィードにスピードと効率をもたらし、ユーザーエンゲージメントを向上させる新しい方法について話してるよ。

現行方法の課題

パーソナライズされたレコメンダーシステムにはいくつかの問題があるよ。よくある主な二つの問題は:

  1. 多様性の制限:ユーザーが一つの埋め込みで表現されると、その広い興味範囲が十分に反映されないことがある。これだと、提案されるアイテムがユーザーの多様な好みを反映しない可能性があるんだ。

  2. リアルタイム更新のコスト:ユーザープロファイルを最新の状態に保つことは、最適な推薦を提供するために重要。でも、リアルタイム更新のために複雑なインフラを維持するのはコストがかかる。

この研究の目的は、これら二つの障壁を実践的に克服することなんだ。

提案された解決策

提案された方法は、顧客プロファイルを動的に更新し、毎分二回、定期的にパーソナライズされたフィードを作成する。これを実現するために、事前に計算された埋め込みとそれらの類似性を利用して、迅速かつ効率的に提案を生成する。このソリューションは、オランダとベルギーのリーディングeコマースプラットフォームBolで実装されていて、顧客エンゲージメントが向上し、コンバージョン率も上がったんだ。

パーソナライズされたフィードの理解

パーソナライズされたフィードは、顧客がクエリで、カタログのアイテムが結果のようなものとして考えられるよ。このフィードがうまく機能するためには、解決すべき大きな課題が四つある:

1. 顧客表現の課題

オンラインで買い物をする際、顧客の行動は複雑になりがち。アイテムを検索したり、表示したり、レビューを読んだり、価格を比較したりするから、これを明確な表現にまとめるのは難しい。最近のインタラクションに加えて、年齢や好みなどの基本的な顧客情報を含めると良いかもしれないね。

2. アイテム表現の課題

オンラインストアのアイテムは、たくさんの情報を持ってる。ID、タイトル、説明、以前の顧客からのフィードバックが含まれる。このプロセスを複雑にしているのは、各アイテムにとって最も関連性の高いデータを見つけることだね。二つの重要な要因がこれを難しくしている:

  • アイテムの特徴の多様性:異なるカテゴリのアイテムには、効果的に表現するための異なる情報が必要な場合がある。
  • 新しい製品:新しく発売されたアイテムは、十分な履歴データがないことが多い。

3. 候補の取得の課題

この課題は、顧客の好みにぴったり合ったアイテムを選ぶことに焦点を当てている。顧客とアイテムの表現を同じ空間にうまくマッピングできるか、広大なカタログから最適なマッチを見つけることに関わってる。

4. ランキングの課題

潜在的なアイテムが取得された後は、顧客の興味にどれだけ合っているかに基づいてランク付けする必要があるね。より複雑なモデルを使うことで、アイテムと顧客のクエリのさまざまな特徴を考慮することができる。

フォーカスエリア

この方法の焦点は、最初の三つの課題、つまり顧客とアイテムを効果的に表現する方法、そして最適な候補アイテムを取得する方法なんだ。

新しい方法の貢献

従来のパーソナライズされたフィードを作成する方法は、ユーザーとアイテムのフレームワークに依存してる。二つのニューラルネットワーク、いわゆるデュアルエンコーダーがユーザーとアイテムのために埋め込みを作成する。でも、これにはいくつかの顕著な欠点があるよ:

  • 単一ベクトル表現のボトルネック:ユーザーを一つのベクトルで表現することは、彼らの興味の複雑さを捉える能力を制限しちゃう。
  • 高インフラおよびメンテナンスコスト:ユーザーの埋め込みをリアルタイムで更新し続けるのはコストがかかる。

新しい方法は、アイテム間の関係に焦点を当てることで、これらの問題を解決している。ユーザーがアイテムとどうインタラクトするかだけでなく、アイテム同士がどのように関連しているかも考慮に入れてるんだ。

方法論

この方法は、トランスフォーマーベースのアーキテクチャを使用して、一度に複数の埋め込みを生成する。各アイテムは、三つの異なる役割で見ることができる:

  1. ビュークエリ:ユーザーがブラウジングセッション中にクリックしたアイテム。
  2. バイクエリ:他のアイテムと一緒によく購入されるアイテム。
  3. ターゲットアイテム:最終的に購入されるアイテム。

これらの表現を一度の実行で作成することで、効率が向上し、必要なプロセスの数が減少するんだ。

モデルのトレーニング

モデルは、ビュー-バイ関係とバイ-バイ関係の二つのセットを使ってトレーニングされる。この際:

  • ビュー-バイペアは、ユーザーが見たアイテムが購入につながったもの。
  • バイ-バイペアは、一緒または近い順番で購入されたアイテム。

トレーニング中にデュアルエンコーダーを使用することで、マッチするペアの埋め込みを類似させつつ、マッチしないペアは異なるものに保つことに焦点を当ててる。

パーソナライズされたフィードの生成

これらのフィードを作成するプロセスは、いくつかのステップを含むよ:

  1. 埋め込みの事前計算:トレーニング後、カタログ内のすべてのアイテムに対して埋め込みが生成される。
  2. 類似性の事前計算:各アイテムのターゲット埋め込みがインデックスされ、システムが最も関連性の高いマッチを効率的に検索できるようになる。
  3. フィードの生成:各顧客のクエリを選択し、潜在的な購入をマッチさせ、さまざまな基準に基づいてこれらのアイテムをランク付けすることで、推薦を得るんだ。

Bolでのパーソナライズされたアイテムフィード

この新しい方法はBolで成功裏に実装され、"あなたへのトップディール"、"あなたへのトップピック"、"あなたへの新商品"というタイトルのいくつかのフィードが生成された。それぞれのフィードはパーソナライズのための異なる要素に焦点を当ててる:

  • あなたへのトップディール:このフィードは割引されたアイテムを強調してる。最近の顧客インタラクションを考慮し、最新のプロモーションを引き出すんだ。

  • あなたへの新商品:このフィードは最近リリースされたアイテムに焦点を当ててる。この方法は、冷スタート問題を巧みに回避して、新製品が十分なインタラクションデータを持たない場合でも、テキストメタデータに基づいて埋め込みを作成する。

これらの戦略を活用することで、Bolは顧客エンゲージメントとコンバージョン率の大幅な向上を実現したんだ。

方法の評価

新しい方法の効果を評価するために、オフラインとオンラインの実験が行われたよ。

オフラインテスト

オフラインテストでは、リコールメトリクスを使用して異なるデザイン選択肢を比較した。データセットはトレーニング、検証、テストセットに分けられた。目的は、推薦されたアイテムがどれだけトップの選択肢に現れたかを見て、方法のパフォーマンスをキャプチャすることだった。

オンラインA/Bテスト

オンライン実験では、パーソナライズされた推薦を受けるグループと標準のものを受けるコントロールグループを比較した。結果は、コンバージョン率が4.9%上昇し、ユーザーのウィッシュリストに追加されたアイテムが大幅に増加したことを示していて、この方法の成功を表してる。

結論

パーソナライズされたフィードを作成する新しいアプローチは、ユーザーに特化した推薦をより早く効率的に提供する方法を提供してる。アイテム間の関係に焦点を当てることで、リアルタイムの展開を簡素化するだけでなく、解釈可能性と効率を向上させているんだ。

今後の作業

この方法のデザインには改善の余地がある。今後の向上に向けて考慮している二つの主な領域は:

  1. 多対多の関係の扱い:現在の方法の複雑な関係を扱う能力を向上させることができる。マルチベクトル表現を探求することで、より広範なアイテム選択が可能になり、様々なユーザーのニーズにより良く応えられるかもしれない。

  2. 記憶と一般化の統合:アイテムの人気と新しい推薦を提案するシステムの能力のバランスを改善できるかもしれない。将来のデザインにおいては、予測パフォーマンスを向上させるために、記憶と一般化の両方を適応的に使用する機能を組み込むことができる。

これらの進展を通じて、パーソナライズされたフィードへのアプローチをさらに洗練させることを目指していて、eコマース顧客の増大する要求に応えられるようにしてるんだ。

オリジナルソース

タイトル: Pfeed: Generating near real-time personalized feeds using precomputed embedding similarities

概要: In personalized recommender systems, embeddings are often used to encode customer actions and items, and retrieval is then performed in the embedding space using approximate nearest neighbor search. However, this approach can lead to two challenges: 1) user embeddings can restrict the diversity of interests captured and 2) the need to keep them up-to-date requires an expensive, real-time infrastructure. In this paper, we propose a method that overcomes these challenges in a practical, industrial setting. The method dynamically updates customer profiles and composes a feed every two minutes, employing precomputed embeddings and their respective similarities. We tested and deployed this method to personalise promotional items at Bol, one of the largest e-commerce platforms of the Netherlands and Belgium. The method enhanced customer engagement and experience, leading to a significant 4.9% uplift in conversions.

著者: Binyam Gebre, Karoliina Ranta, Stef van den Elzen, Ernst Kuiper, Thijs Baars, Tom Heskes

最終更新: 2024-03-06 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2402.16073

ソースPDF: https://arxiv.org/pdf/2402.16073

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事