新しい評価方法でシーケンシャルレコメンダーシステムを進化させる
複数の関連アイテムに注目して、推薦を改善する新しいアプローチ。
― 1 分で読む
レコメンダーシステムは、過去の行動や好みに基づいて人が気に入りそうなアイテムを見つける手助けをするツールだよ。オンラインショッピングや映画ストリーミング、音楽サービスなど、日常生活の中でよく見かける。特に「逐次レコメンダーシステム(SRS)」っていうタイプがあって、ユーザーがアイテムとどのように関わるかの順序を見て、次に何を求めるかをより良く提案するんだ。
でも、実際のユーザーの行動って結構複雑なんだよね。アカウントを共有したり、興味が変わったり、偶然アイテムをクリックしたりすることもある。こういうノイズがあると、SRSが関連するアイテムを提案するのが難しくなる。そこで、これらの課題を考慮した新しい方法を提案したんだ。
新しいアプローチの必要性
従来のSRSの評価方法は、ユーザーが気に入りそうな未来のアイテムを1つだけ予測することに焦点を当てることが多いんだけど、これだと多くのアイテムが同時に関連することを考慮できないんだ。ノイズの多い履歴の場合、1つのアイテムを選ぶだけでは本当の好みを反映しないことがある。ユーザーはいろんな理由でいろんなアイテムをクリックすることがあるから、1つだけ選ぶとシステムを誤解させるかもしれない。
そこで、ユーザーが次に見たいと思う複数のアイテムを考慮した新しい評価方法を開発したんだ。この方法は、ユーザーが好きかもしれない多くのアイテムを考慮して、複雑な行動をよりよく扱えるようにしてる。
新しい評価プロトコル
新しい評価プロトコルは「マルチ・フューチャー・アイテム(MFI)」って呼ばれてる。この方法は、良いレコメンデーションは、ユーザーが興味を持つかもしれない未来のアイテムの全体を考慮するべきだって前提してる。これによって、複数の未来のアイテムを正しくランク付けできるモデルが報われるんだ。
実際には、ユーザーを評価する時に、インタラクションの履歴の一部をテスト用にとっておいて、残りはモデルのトレーニングに使うんだ。これでモデルが時間をかけてユーザーの好みの全体像を理解できるようになる。
アイテムの関連性
新しい評価方法の重要な部分は、アイテムの関連性を理解すること。アイテムがすべて同じように重要ではないってこと。あるアイテムは、ユーザーの履歴の中での位置に基づいて、他のアイテムよりも関連性が高い場合があるんだ。たとえば、ユーザーが次に関わるアイテムは、後に来るアイテムよりも関連性が高いかもしれない。
アイテムの関連性をいくつかの関数に分類してる。ある関数はすべてのアイテムを平等に扱うけど、他の関数はインタラクションの順序で早く現れるアイテムにより大きな重要性を与える。これによって、モデルがトレーニングや評価の際にどのアイテムを優先すべきかを学ぶのを助けるんだ。
新しい損失関数
モデルが関連性のあるアイテムに注目できるように、新しい損失関数「関連性ベースの損失」を導入した。この損失関数は、アイテムの関連性に基づいて異なる重みを割り当てることで機能する。トレーニング中に、モデルはより重要なアイテムにもっと注意を向けられるように促される。このアプローチは、モデルがトレーニングデータからより良く学ぶことを可能にして、レコメンデーションの改善につながる。
実験とデータセット
いくつかの実世界のデータを使って方法をテストした。2つのデータセットはMovieLensからで、映画の評価が含まれてる。もう1つのデータセットはFoursquareからで、いろんな都市のユーザーのチェックイン記録が含まれてる。
実験では、逐次推薦の分野で人気のあるSASRecというモデルを使った。よく知られた設定と構成を守ることで、新しい評価プロトコルと損失関数のパフォーマンスを公正に評価できるようにしたんだ。
結果
テストの結果、私たちの新しいアプローチが関連性のあるアイテムを推奨するパフォーマンスが改善されることがわかった。特に、モデルは複数の関連する未来のアイテムを考慮したシナリオで特に顕著な改善を示した。
研究課題1: 代替評価プロトコル
まず最初に新しい評価方法が、複数のモデルの中でどのモデルが最も性能が良いかをより良く判断できるかを見たんだ。従来の評価方法でのテストでは、結果があまりはっきりしなくて明確な勝者がいなかった。でも、新しいプロトコルを使ったら、パフォーマンスの違いが明らかになった。新しい方法は、本当に性能が良いモデルとそうでないモデルを特にノイズの多い環境で特定するのが得意だった。
研究課題2: アイテムの関連性の組み込み
次に、トレーニングプロセスにアイテムの関連性を組み込むことでパフォーマンスが向上するかどうかを探求した。調査結果では、アイテムの関連性を含めたモデルは、そうでないモデルよりも一般的に良い性能を示した。特に、線形のアイテム関連性モデルはしばしば他のモデルを上回り、複数の関連するアイテムを考慮することがより良いレコメンデーションにつながることを示した。
研究課題3: 未来のアイテムの影響
最後に、考慮された未来のアイテムの数が評価やトレーニングのパフォーマンスにどう影響するかを理解したいと思った。実験では、複数の未来のアイテムを考慮する利点がさまざまなシナリオで一貫して得られることが示された。重要なのは、新しい評価プロトコルを使った場合、トレーニングのポジティブ数が増えるとモデルのパフォーマンスが改善されたことで、レコメンデーションのさらなる成長の余地があることを示してる。
結論
この研究では、通常は1つの即時的な次のアイテムを予測することに焦点を当てる従来の逐次レコメンダーシステムの見方に挑戦したんだ。代わりに、複数の未来のアイテムを考慮する新しい評価プロトコルを導入して、関連性ベースの損失関数を開発した。
私たちの発見は、トレーニングと評価の両方でより多くのポジティブな例に焦点を当てることの重要性を強調してる。私たちの方法がより良いパフォーマンスを引き出し、既存のモデルを上回ることができることを示した。アイテムの関連性が適切に考慮されることを確実にすることで、より効果的なレコメンデーションシステムが実現するんだ。
今後、この分野でさらに改善の余地があると思ってる。私たちの研究は、実世界のシナリオでユーザーにより良いサービスを提供できる、より高度で微妙なレコメンダーシステムの道を開くものだよ。
タイトル: Integrating Item Relevance in Training Loss for Sequential Recommender Systems
概要: Sequential Recommender Systems (SRSs) are a popular type of recommender system that learns from a user's history to predict the next item they are likely to interact with. However, user interactions can be affected by noise stemming from account sharing, inconsistent preferences, or accidental clicks. To address this issue, we (i) propose a new evaluation protocol that takes multiple future items into account and (ii) introduce a novel relevance-aware loss function to train a SRS with multiple future items to make it more robust to noise. Our relevance-aware models obtain an improvement of ~1.2% of NDCG@10 and 0.88% in the traditional evaluation protocol, while in the new evaluation protocol, the improvement is ~1.63% of NDCG@10 and ~1.5% of HR w.r.t the best performing models.
著者: Andrea Bacciu, Federico Siciliano, Nicola Tonellotto, Fabrizio Silvestri
最終更新: 2023-06-10 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2305.10824
ソースPDF: https://arxiv.org/pdf/2305.10824
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。