生成的クリエイティブ最適化:広告ビジュアルへの新しいアプローチ
GCOを紹介するよ、ユーザーの興味を使って広告のビジュアルを強化して、もっとエンゲージメントを高める方法なんだ。
― 1 分で読む
デジタル広告の世界では、ユーザーに見せる正しい商品を選ぶことと、それをできるだけ良く見せることの2つが重要な部分なんだ。この2つは通常別々に見られてるけど、どっちもユーザーが広告を楽しみ、関与する度合いに重要な役割を果たしてる。つまり、広告がどれだけ効果的かは、商品の関連性だけでなく、特にビジュアルがどれだけうまく見せられているかにも関係してるんだ。
そこで、Generative Creative Optimization (GCO) という新しいタスクを提案するよ。GCOはユーザーの興味を使って、より良い広告ビジュアルを作ることを目指してるんだ。そして、AdBoosterというモデルも紹介するよ。これはStable Diffusion outpaintingという方法を使って、ユーザーの興味を考慮してパーソナライズされた広告ビジュアルを作るために設計されてるんだ。さらに、AdBoosterで使うデータを改善する自動化された方法も開発したよ。テストの結果、AdBoosterが生成するビジュアルは標準的な商品画像よりもユーザーに関連性が高く、より良いユーザーエンゲージメントにつながる可能性があることがわかったよ。
クリエイティブ最適化とは?
クリエイティブ最適化は広告の重要な部分で、商品を観客にどう見せるかに焦点を当ててる。おすすめ商品を見せるベストな方法を見つけることを目指していて、内容よりも創造性やプレゼンテーションを重視してるんだ。これが重要なのは、ユーザーが広告にどれだけ関与するかに大きな影響を与えるからだよ。
従来の広告手法は主にユーザーと商品をマッチさせることに焦点を当ててるけど、クリエイティブの最適化がユーザーの行動に影響を与えるってことはしばしば無視されてる。たとえば、あるユーザーが作業用の靴を探していて、バスケットボールの設定で関連商品が表示されても、あまり注目を引かないかもしれない。商品の見せ方は本当に重要なんだ。
現在のクリエイティブ最適化のアプローチ、例えばContextual Multiarmed Banditsは、各アイテムの選択肢が少ないときはうまく動作するけど、テキストから画像を作る新しいツールが出てきた今、クリエイティブ最適化をおすすめと密接に結びつける機会があるんだ。これが大きな改善につながるかもしれない。
私たちの提案
デジタル広告の最大の課題の一つは、幅広いユーザーの興味に結びつく広告を作ることなんだ。広告のクリエイティブな部分はユーザーとのインタラクションに大きな影響を与えるから、パーソナライズされたコンテンツが成功するために欠かせないんだ。現在の広告作成手法はある程度効果的だけど、個々のユーザーに合わせたコンテンツを提供するのは難しいことが多い。
このギャップを埋めるために、Generative Creative Optimization (GCO)の概念を提案するよ。このアプローチは、ユーザーの興味に関する情報を使ってパーソナライズされた広告ビジュアルを作る手助けをするんだ。AdBoosterというモデルを紹介することもできるよ。これはStable Diffusion outpainting技術に基づいて広告ビジュアルを生成するんだ。AdBoosterは、トレーニング段階と生成段階の両方でユーザーの興味を統合して、ビジュアルが各ユーザーの好みに合わせて調整されることを保証してる。これは広告のパーソナライズにおいて大きなステップだよ。
さらに、AdBoosterのパフォーマンスを強化するために新しい自動化データプロセスも含めてる。このプロセスはAdBoosterのトレーニング段階にフィードバックして、ビジュアルの生成方法にもう一つの最適化レイヤーを加えるんだ。
私たちはいくつかのテストを行って、アプローチを検証したよ。その結果、AdBoosterが生成したビジュアルは標準的な商品画像よりもユーザーに関連性が高く、より良いユーザーエンゲージメントを示したんだ。
関連研究
クリエイティブ最適化は機械学習の分野であまり探求されてこなかったけど、推薦システムの広範な研究に影響されてきた。クリエイティブ最適化の目標は、推奨されたアイテムがどう見せられるかを扱うことで、ユーザーとのインタラクションにとって重要なんだ。
Contextual Multiarmed Bandits手法は、限られた選択肢があるときにクリエイティブ最適化でよく使われる。この方法は新しいアイデアをテストしつつ、何が最も効果的かを見つけるバランスをとるんだ。
最近の画像やテキスト生成の進展は、パーソナライズされた広告作成の新たな可能性を開いたよ。Stable Diffusionのような新しいモデルは、書かれた説明に基づいて非常にリアルな画像を作成できるんだ。これにより、広告のクリエイティブ最適化が進化して、推薦との連携がより効果的に行われるオプチュニティが生まれたんだ。
物理の概念に触発された拡散モデルは、実装が簡単なより単純な形に適応されてきた。このモデルは画像生成で素晴らしい結果を出してるけど、生成速度が遅いとか、トレーニングに高いリソースを必要とするなどの課題も抱えてる。
私たちの研究は、特にファッションや小売セクターのような独自の課題を抱えるパーソナライズ広告の作成において、これらの新しい生成AIの発展を活用することを目指してるんだ。広告クリエイティブシステムは、多様なファッションシーンや背景を管理しつつ、ビジュアル内のすべての要素が自然にフィットするようにする必要があるんだ。
アプローチ
このセクションでは、GCOを通じて推薦とクリエイティブ最適化をつなげる方法を説明するよ。これは、テキスト説明に基づいて画像を作成するための高度なモデルを使うんだ。
問題定義
私たちのアプローチがどのように機能するかを理解するために、まず通常の推薦およびクリエイティブ最適化の目標をそれぞれ示すよ。
推薦タスクでは、ユーザーが見たいアイテムを興味に基づいて提供することを目指してる。結果は通常、クリックや購入のようなユーザーのインタラクションで測定されるんだ。
一方で、クリエイティブ最適化は提示された商品のために最良のビジュアルを選ぶことに関するもの。実際には、特定のユーザーグループに対してどの画像が最も効果的かをテストすることがよくあるんだ。
従来の方法は各商品に対して限られたセットの画像を扱うけど、私たちのアプローチでは画像を生成することで無限のクリエイティブオプションが可能なんだ。これにより、クリエイティブ最適化は固定された選択肢のタスクから、継続的に進化できるタスクへと変わるんだ。
Stable Diffusion Outpaintingを使ったGenerative Creative Optimization
Stable Diffusion outpaintingモデルを使って広告ビジュアルを生成することに特に焦点を当ててるよ。このモデルはテキストプロンプトやユーザーの興味に基づいて、画像を作成したり強化したりできるんだ。
ユーザーのコンテキストを反映したパーソナライズされた画像生成が、標準的なアプローチと比べてどれだけうまく機能するかをチェックするよ。目標は、生成された画像の質がユーザーの好みに合わせると大幅に改善されることを示すことなんだ。
広告クリエイティブ生成のためのファインチューニング
AdBoosterの効果は、広告クリエイティブ生成を処理できるようにStable Diffusionをファインチューニングすることにかかってる。Stable Diffusionは元々小さな領域のために設計されてたから、商品の核心を変えずにより広いエリアに適用できるようにする必要があったんだ。
ファインチューニングプロセスでは、モデルの特定の部分だけを更新し、他の部分は元の能力を維持するために残しておく必要がある。効果的にファインチューニングを行うためには、マスクやキャプションのある強力な画像データセットが必要だけど、そんなデータセットはしばしば不足してるんだ。
この問題を解決するために、既存の画像から必要な商品マスクやプロンプトを生成するデータ拡張プロセスを考案したよ。このプロセスは、データセットのクリーンアップ、商品マスクの抽出、そして新しい機械学習技術を使って対応するテキストプロンプトを生成することから成り立ってるんだ。
さらに、生成中に商品画像が変わらないように、モデルの損失関数に特定のルールを追加できるけど、私たちの経験からすると、単に拡張データでファインチューニングするだけでも効果的だったんだ。
ユーザー表現とプロンプト戦略
パーソナライズがユーザーにどう影響するかを調べるためには、まずユーザーの明確な表現が必要だよ。ユーザーを、彼らの製品クエリとコンテキストの両方で定義するんだ。たとえば、ユーザーが「結婚式」のために「赤い靴」を探している場合などだね。
私たちのフレームワークでは、ユーザーの明示的な表現や、推奨された商品とユーザーのコンテキストを考慮した言語モデルによって生成されたプロンプトを使って新しい画像を作成するよ。
実験設定
私たちのアイデアをテストするために、構造化された設定を設計したよ:
- 画像と説明を含むオープンデータセットを選んだ。
- 製品クエリとコンテキストバックグラウンドを組み合わせて人工的なユーザー表現を作成した。
- ユーザーと商品の類似性に基づいて、合成されたユーザー商品ペアのセットを形成した。
ベースライン
実験では、生成されたビジュアルを、通常は単色の背景に商品が表示される標準的な商品画像と比較した。さらに、元の設定での商品を特徴とする2つ目のベースラインとも評価したよ。
パフォーマンスメトリクス
私たちの手法をベースラインと比較するために、商品ビジュアルに対するユーザーの応答を評価するよ。私たちの目標は、ユーザーが見た画像に基づいて商品を購入する可能性がどれほど高いかを判断することなんだ。
実験結果
私たちはGCOアプローチのパフォーマンスを2つのベースラインと比較するテストを行ったよ。各テストでは、異なる画像を生成して、ユーザーの関心信号に基づいて最も効果的なものを選んだ。
結果は、私たちのアプローチで生成されたビジュアルが従来の手法を上回ったことを強調してる。特に、AdBoosterモデルがユーザーにより響く画像を生成し、強いエンゲージメントにつながったんだ。
定性的分析
ビジュアルの観点から見ると、私たちのモデルは生成された画像の背景を標準画像よりもユーザーの興味により密接に合わせているみたい。このことは、GCOメソッドで生成された広告にユーザーがより関与する可能性が高いことを示唆しているよ。
直面した課題
ポジティブな結果にもかかわらず、私たちの研究中にはいくつかの課題に直面したよ。時々、画像生成において、ビジュアルの繰り返しやライティングの不一致、リアルに人を描写することの困難さといった問題が見られたんだ。
将来的には、より高度な技術のテストを通じて、モデルの能力を向上させることを目指しているよ。これにより、画像の質やディテールがより良くなることを期待している。
結論
私たちはGenerative Creative Optimization (GCO)を開発することで、パーソナライズされた広告ビジュアルを作成する上で大きな進展を遂げたよ。私たちのモデルであるAdBoosterは、ユーザーの興味を効果的に活用してカスタマイズされた広告を生成することを示している。自動化データプロセスの統合は、モデル全体の堅牢性を向上させているんだ。
推薦とクリエイティブ最適化の戦略を調整することで、デジタル広告のパフォーマンスを改善する効果的な相乗効果が生まれたよ。広範な実験を通じて、AdBoosterを通じて生成されたビジュアルは、標準的な画像よりもより関連性が高く、エンゲージメントが向上することを証明したんだ。
全体的に見て、私たちの研究はデジタル広告における将来の研究の有望な方向性を示しているよ。これからも方法をさらに洗練させて、実際のユーザーフィードバックを取り入れ、生成の柔軟性と質を改良するための高度なアーキテクチャを探索していくつもりなんだ。
タイトル: AdBooster: Personalized Ad Creative Generation using Stable Diffusion Outpainting
概要: In digital advertising, the selection of the optimal item (recommendation) and its best creative presentation (creative optimization) have traditionally been considered separate disciplines. However, both contribute significantly to user satisfaction, underpinning our assumption that it relies on both an item's relevance and its presentation, particularly in the case of visual creatives. In response, we introduce the task of {\itshape Generative Creative Optimization (GCO)}, which proposes the use of generative models for creative generation that incorporate user interests, and {\itshape AdBooster}, a model for personalized ad creatives based on the Stable Diffusion outpainting architecture. This model uniquely incorporates user interests both during fine-tuning and at generation time. To further improve AdBooster's performance, we also introduce an automated data augmentation pipeline. Through our experiments on simulated data, we validate AdBooster's effectiveness in generating more relevant creatives than default product images, showing its potential of enhancing user engagement.
著者: Veronika Shilova, Ludovic Dos Santos, Flavian Vasile, Gaëtan Racic, Ugo Tanielian
最終更新: 2023-09-08 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2309.11507
ソースPDF: https://arxiv.org/pdf/2309.11507
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://www.argmin.net/2017/04/03/evolution/
- https://arxiv.org/pdf/1803.07055.pdf
- https://www.argmin.net/2018/02/20/reinforce/
- https://arxiv.org/pdf/1703.03864.pdf
- https://mediatum.ub.tum.de/doc/1287490/1287490.pdf
- https://openai.com/blog/evolution-strategies/
- https://www.inference.vc/evolutionary-strategies-embarrassingly-parallelizable-optimization/
- https://colab.research.google.com/drive/1SY38Evy4U9HfUDkofPZ2pLQzEnwvYC81?usp=sharing
- https://towardsdatascience.com/perceptual-losses-for-image-restoration-dd3c9de4113
- https://github.com/crowsonkb/simulacra-aesthetic-models
- https://arxiv.org/pdf/2208.01618.pdf
- https://keras.io/examples/generative/random_walks_with_stable_diffusion/
- https://arxiv.org/pdf/2204.06125.pdf
- https://lilianweng.github.io/posts/2021-07-11-diffusion-models/