百度のMobiusシステムが広告マッチングの効率を向上させた
バイドゥがモビウスを導入、検索結果の広告の関連性と収益を向上させる。
Miao Fan, Jiacheng Guo, Shuai Zhu, Shuo Miao, Mingming Sun, Ping Li
― 1 分で読む
目次
百度は中国で最大の検索エンジンで、毎日何百万もの人々が質問の答えを見つける手助けをしているんだ。百度のビジネスの大部分は、その検索に関連する広告を表示することから得られてる。でも、正しい広告を迅速に正しい人に届けるのは難しい。そこで、百度はMobiusっていうシステムを作ったんだ。このシステムは、広告とユーザーの検索をよりよくマッチングさせることを目指してる。
変化の必要性
以前は、百度は広告を管理するためにファネルのような構造のシステムを使ってた。このシステムは三つの層から成ってて、最初の層がユーザーのクエリに関連する広告を見つけ、二つ目の層がいろんな要素を考慮して選択を改善し、最後の層がこれらの広告を表示のためにランク付けしてた。この方法は効率的だったけど、層が最適に連携してなかったせいで、潜在的な利益を逃すことがよくあった。例えば、最初の層は主にクエリに広告を合わせることに集中してて、表示されたときにどれだけお金を生むかを考慮してなかった。
その結果、関連性の高い広告が表示されないことがあったんだ、なぜならそんなにお金を生まないと思われていたから。このせいで、百度とその広告主にとって投資対効果が低くなっちゃった。これらの問題を解決するために、百度はMobiusプロジェクトを始めた。
Mobiusって何?
Mobiusは、広告とユーザーの検索をより良くマッチングさせることを目指す新しいシステムなんだ。その主な目標の一つは、広告がクエリにどれだけ関連があるかだけじゃなくて、百度のためにどれだけお金を稼げるかも考慮すること。つまり、広告を表示する際にユーザーの満足度とビジネスパフォーマンスの両方を考えるようにシステムを教育するってこと。
Mobius-V1は、この新しいシステムの最初のバージョン。大量のデータを元に、ユーザーが広告をクリックする可能性(クリック率、CTRとも呼ばれる)を予測するために高度な機械学習技術を使ってる。過去のクリック履歴だけじゃなくて、Mobius-V1は広告のパフォーマンスをよりよく理解するために新しいトレーニングデータも作るんだ。
出会った問題
Mobiusを構築する中で、百度はいくつかの課題に直面した。
不十分なクリック履歴
主な問題の一つはデータの不足。以前のモデルはよく見られる広告やクエリ(高頻度アイテム)でうまく機能してたけど、あまり一般的でないクエリや広告の結果を正確に予測するのは難しかった。このせいで、クリック率が低くなることが多かったんだ。
高いリソースコスト
もう一つの問題は、何十億ものクエリと広告を処理するために必要なコンピュータパワーが膨大だったこと。システムが大きくなり、複雑になるにつれて、リソースの必要性も増して、迅速な結果を提供できるより効率的な方法が求められるようになった。
実施された解決策
これらの課題を克服するために、百度は教師-生徒のフレームワークを設計した。この設定では、「教師」モデルがユーザーのクエリに基づいてさまざまな広告の関連性を評価し、「生徒」モデルがこの情報を学んでクリック率の予測を改善するんだ。この二つのモデルの相互作用により、システムは自分の間違いから学び、パフォーマンスを向上させることができる。
アクティブラーニング技術
Mobius-V1は、トレーニングプロセスを強化するためにアクティブラーニング戦略を採用してる。既存のデータだけに頼るのではなく、合成クエリ-広告ペアを作る。これらの新しいペアは、教師モデルによって評価されて、関連性は低いけどクリック率が高いかもしれない広告を特定するんだ。この「悪いケース」に焦点を当てることで、生徒モデルは低マッチの広告でもクリックされる可能性が高いものをよりよく認識して扱えるようになる。
効率的な広告取得
莫大な数の広告を管理するために、Mobiusは近似最近傍(ANN)検索方法を使用して迅速に取得する。システムは、ユーザーのクエリに対してすべての広告を比較するのではなく、最適なフィットが期待できる広告の小さなグループに素早く絞り込むことができる。このプロセスにより、広告を表示するのにかかる時間が大幅に短縮されながら、高い精度を維持することができる。
Mobius-V1の結果
Mobius-V1を導入した後、百度はそのパフォーマンスを評価するために広範なテストを行った。結果は良好で、以前のシステムに比べて著しい改善が見られた。
収益の増加
Mobius-V1は、千インプレッションあたりのコスト(CPM)で測定した収益の大幅な増加をもたらした。特に、百度はモバイルアプリで約3.8%、デスクトップ検索エンジンで約3.5%の改善を観察した。この増加は百度にとって重要で、広告が収益を生む効果が高まっていることを直接示している。
広告のカバレッジの向上
新しいシステムは、表示される広告の範囲も改善し、33.2%も関連性の高い広告をカバーするようになった。これにより、ユーザーは自分のニーズに合った広告を見やすくなって、より満足のいく検索体験が実現できる。
未来の方向性
Mobius-V1は、百度の広告マッチング機能において大きな前進を示しているけれど、成長や改善の機会はまだまだたくさんある。
もっとビジネスメトリクスの探求
これからは、百度は広告マッチングシステムに投資対効果(ROI)などのビジネスターゲットを統合するつもり。そうすることで、システムはクエリにマッチするだけじゃなくて、百度の利益にプラスになる広告を表示するのにさらに効果的になる。
コンピュータの効率向上
広告マッチングのタスクが複雑になるにつれて、効果と効率のバランスを取る必要性が続く。未来のMobiusバージョンは、このトレードオフを慎重に乗り越えながら、より多くの目的が追加されてもパフォーマンスが損なわれないようにしないといけない。
先進技術の活用
さらに、広告取得速度を向上させるためにグラフィックス処理装置(GPU)を活用する可能性もある。GPUは膨大なデータを迅速に処理できるから、Mobiusのようなシステムのパフォーマンスを改善するのに最適なんだ。
結論
百度のMobiusプロジェクトは、検索エンジンが広告をユーザーのクエリに効果的にマッチさせる能力において重要なステップだね。ユーザーの満足度とビジネスパフォーマンスの両方を広告マッチングプロセスに取り入れることで、Mobiusは百度のスポンサー検索サービスの全体的な効率と収益性を向上させることが期待されてる。これからも、このシステムをさらに強化する機会がたくさんあって、百度がオンライン広告の競争が激しい世界でリードし続けることができるようにするんだ。
タイトル: MOBIUS: Towards the Next Generation of Query-Ad Matching in Baidu's Sponsored Search
概要: Baidu runs the largest commercial web search engine in China, serving hundreds of millions of online users every day in response to a great variety of queries. In order to build a high-efficiency sponsored search engine, we used to adopt a three-layer funnel-shaped structure to screen and sort hundreds of ads from billions of ad candidates subject to the requirement of low response latency and the restraints of computing resources. Given a user query, the top matching layer is responsible for providing semantically relevant ad candidates to the next layer, while the ranking layer at the bottom concerns more about business indicators (e.g., CPM, ROI, etc.) of those ads. The clear separation between the matching and ranking objectives results in a lower commercial return. The Mobius project has been established to address this serious issue. It is our first attempt to train the matching layer to consider CPM as an additional optimization objective besides the query-ad relevance, via directly predicting CTR (click-through rate) from billions of query-ad pairs. Specifically, this paper will elaborate on how we adopt active learning to overcome the insufficiency of click history at the matching layer when training our neural click networks offline, and how we use the SOTA ANN search technique for retrieving ads more efficiently (Here ``ANN'' stands for approximate nearest neighbor search). We contribute the solutions to Mobius-V1 as the first version of our next generation query-ad matching system.
著者: Miao Fan, Jiacheng Guo, Shuai Zhu, Shuo Miao, Mingming Sun, Ping Li
最終更新: 2024-09-05 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2409.03449
ソースPDF: https://arxiv.org/pdf/2409.03449
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。