XWalk: 商品検索の新しい方法
XWalkは、商品検索をおすすめとして扱うことで、eコマースの効果を高める。
― 1 分で読む
オンラインショッピングでは、ほとんどの売上は人気のある検索から来る、いわゆる「ヘッドクエリ」と呼ばれるものだよ。この一般的なクエリの扱いを改善することで、eコマースビジネスに大きな違いをもたらすことができるんだ。多くの検索システムは、まず少数の関連商品を素早く見つけるレイヤーと、それらをより正確にランク付けする別のレイヤーの二層構造になっているよ。最初のレイヤー、つまり候補取得を改善することで、全体の効果を高めることができるんだ。
現在の検索方法の問題
現在の検索方法は、人気のあるクエリには確実にうまくいくけど、あまり一般的でないクエリにはあまり良くないことが多い。これは主に学習に使えるデータの量が原因なんだ。人気のあるクエリには通常、より多くの例が存在するから、モデルは学びやすく、良い成績を出しやすい。しかし、まだ改善の余地はあるよ。レコメンデーションのやり方からアイデアを取り入れることで、一般的なクエリに対して検索方法をより良くすることができる。
XWalkの紹介
新しい候補取得法「XWalk」を紹介するよ。検索を単にユーザーのクエリと商品を結びつけるだけだと考えるのではなく、XWalkは検索クエリ自体に基づいて商品リストを推薦するタスクとして捉えるんだ。この方法は、忙しいオンラインショッピング環境でも効率的にトレーニングし、使用できるんだ。
XWalkは、商品リストとクエリの相互作用を表すグラフでランダムウォークを活用しているよ。このアプローチは、特に人気のあるクエリに対して既存のニューラルネットワークベースの検索方法を上回ることができる。XWalkを他の取得方法と組み合わせることで、どの方法単独よりも優れたシステムを作れるんだ。
XWalkの仕組み
従来の検索アプローチは、グラフから特徴を構築することが多いけど、それを取得に直接使用することは少ない。XWalkはこれを変えて、ユーザーと商品をインタラクションでつなぐノードとして表現する推薦システムの相互作用グラフを利用するんだ。
ランダムウォークの方法が推薦を生成する助けになる。XWalkでは、過去のデータに基づいてユーザーのクエリと商品リストからグラフを作成するよ。このグラフは、典型的なニューラルネットワークアプローチと比較して効率的なんだ。
グラフの構築
XWalkに使用するグラフを構築するために、まずは過去1年間のユーザーインタラクションをログとして取るよ。各ユニークなクエリと商品をノードとして追加し、それらのインタラクションがエッジを形成する。このエッジの重みは、ユーザーの行動(クリックや購入など)に基づいてクエリから商品がどれだけ良く転換するかを示すんだ。
この重み付けされたグラフを使うことで、特定のクエリに対する商品のパフォーマンスに基づいて商品を優先順位付けできるから、より良い推薦ができるんだ。
効率的な推論
グラフが構築されたら、検索クエリに対して関連するリストを効率的に取得できるよ。深さ優先探索を使う代わりに、XWalkは幅優先探索法を用いることで、検索プロセスをより迅速で効率的にするんだ。
ユーザーがクエリを検索すると、過去にどれだけ推薦されたかに基づいてリストをランク付けし、その中から関連するリストをサンプリングするよ。
グラフの拡張
私たちのeコマースプラットフォームは、多くの独立した売り手を特徴としていて、さまざまなリストが揃っているんだ。グラフをさらに有用にするために、ショップや商品に関連するタグのノードを追加することができるんだ。こうすることで、歴史的なインタラクションが少ない場合でも商品同士をよりよくつなげられる。
グラフにもっと要素を含めることで、XWalkはまだあまり注目されていない新しい商品も扱えるようになり、事前データが少ないときの問題を解決できるんだ。
データ収集
実験のために、私たちはユーザーと商品のインタラクションに関する1年分のデータを集めたよ。このデータには、クリック、ショッピングカートに追加したアイテム、購入が含まれているんだ。各クエリと商品は売上に結びついていて、これによってモデルはユーザーが何を欲しがっているのかをより明確に理解できる。
私たちは多種多様なクエリとリスト、さらにユーザーインタラクションを収集したよ。このデータ量があるおかげで、XWalkはさまざまなショッピングシナリオに対応できるようにしっかりとトレーニングされているんだ。
実験のセットアップ
XWalkのパフォーマンスを評価するために、2つの他の取得方法と比較したよ。1つ目はテキストマッチングに基づいた従来の方法(BM25)で、2つ目はより高度なニューラルネットワークを使用した方法(NIR)だ。それぞれの方法が、ユーザーのクエリに対してどれほど関連商品の検索が効果的かをテストしたんだ。
各方法のパフォーマンスを、発見された関連結果の数を示すリコールや返された結果の質を示す平均適合率などの指標を使って測定したよ。
結果と発見
XWalkは人気のあるクエリに対して強力なパフォーマンスを示して、他の方法を大幅に上回ったんだ。BM25と組み合わせても、関連商品の取得において精度が改善されることがわかったよ。
XWalkは珍しいクエリや新しいクエリに対してはあまり効果的ではないけど、人気のクエリセグメントでは優れているから、eコマースの売上にとっては重要なんだ。一方で、BM25はテキストの類似性に重きを置くため、新しいクエリに対してはより良い結果を出すことができる。
オンライントesting
XWalkは大手eコマースプラットフォームでライブ設定でテストされたよ。実験の結果、XWalkを組み込むことで商品検索のコンバージョン率が目に見えて向上したんだ。また、レスポンスタイムが短く、他のシステムよりも早く結果が返されることが確認されたよ。
結論
XWalkは商品検索を過去のユーザー行動に基づく推薦問題として扱う新しい方法を提供するんだ。この方法は特に人気のあるクエリに対して効率的で、売上に大きな影響を与えることができる。XWalkは他の取得方法とも上手く連携するから、既存の検索システムにとって貴重な追加となるんだ。XWalkとテキストベースやニューラルモデルを組み合わせることで、eコマースのための強力な検索ソリューションを作ることができるよ。
タイトル: XWalk: Random Walk Based Candidate Retrieval for Product Search
概要: In e-commerce, head queries account for the vast majority of gross merchandise sales and improvements to head queries are highly impactful to the business. While most supervised approaches to search perform better in head queries vs. tail queries, we propose a method that further improves head query performance dramatically. We propose XWalk, a random-walk based graph approach to candidate retrieval for product search that borrows from recommendation system techniques. XWalk is highly efficient to train and inference in a large-scale high traffic e-commerce setting, and shows substantial improvements in head query performance over state-of-the-art neural retreivers. Ensembling XWalk with a neural and/or lexical retriever combines the best of both worlds and the resulting retrieval system outperforms all other methods in both offline relevance-based evaluation and in online A/B tests.
著者: Jon Eskreis-Winkler, Yubin Kim, Andrew Stanton
最終更新: 2023-07-22 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2307.12019
ソースPDF: https://arxiv.org/pdf/2307.12019
ライセンス: https://creativecommons.org/licenses/by-nc-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。