Simple Science

La science de pointe expliquée simplement

# Informatique# Recherche d'informations# Apprentissage automatique

Optimisation Créative Générative : Une Nouvelle Approche pour les Visuels Publicitaires

Voici GCO, une méthode qui améliore les visuels des annonces en se basant sur les intérêts des utilisateurs pour un meilleur engagement.

― 12 min lire


Visuels publicitairesVisuels publicitairesréinventésdes utilisateurs.personnalisés pour capter l'engagementGCO transforme la pub avec des visuels
Table des matières

Dans le monde de la pub digitale, il y a deux trucs super importants : choisir le bon produit à montrer aux utilisateurs et faire en sorte qu'il ait l'air aussi bien que possible. Ces deux trucs ont souvent été vus comme séparés. Pourtant, ils jouent tous les deux un rôle clé dans le plaisir et l'engagement des utilisateurs avec les pubs. Ça suggère que l'efficacité d'une pub dépend pas seulement de la pertinence du produit, mais aussi de la façon dont il est présenté, surtout visuellement.

Pour ça, on introduit une nouvelle tâche appelée Optimisation Créative Générative (GCO). Le but du GCO, c'est de créer de meilleures visuels pour les pubs en se basant sur les intérêts des utilisateurs. On présente aussi un modèle appelé AdBooster, qui utilise une méthode appelée outpainting de diffusion stable. Ce modèle est conçu pour créer des visuels de pub personnalisés en tenant compte des intérêts des utilisateurs pendant les phases d'entraînement et de génération. De plus, on a développé une méthode automatisée pour améliorer les données utilisées dans AdBooster. Nos tests montrent qu'AdBooster génère des visuels plus pertinents pour les utilisateurs que les images de produits standards, ce qui pourrait améliorer l'engagement des utilisateurs.

C'est quoi l'Optimisation Créative ?

L'optimisation créative est une partie critique de la pub qui se concentre sur comment les produits sont présentés au public. Elle vise à trouver la meilleure façon de montrer les produits recommandés, en mettant l'accent sur la créativité et la présentation plutôt que sur le contenu. C'est important parce que ça peut influencer énormément l'engagement des utilisateurs avec les pubs.

Les méthodes publicitaires traditionnelles se concentrent principalement sur comment faire correspondre les utilisateurs avec des produits. Cependant, elles ignorent souvent comment l'optimisation créative peut affecter le comportement des utilisateurs. Par exemple, si un utilisateur cherche des chaussures de travail et voit un produit pertinent affiché dans un cadre de basket, ça risque de ne pas attirer son attention. La façon dont un produit est montré compte vraiment.

Les approches actuelles de l'optimisation créative, comme les Bandits Multi-brins Contextuels, fonctionnent bien quand il n'y a que quelques options pour chaque article. Mais dans le monde d'aujourd'hui, avec les nouveaux outils pour créer des images à partir de texte, il y a une opportunité d'aligner l'optimisation créative de près avec les recommandations, ce qui peut mener à des améliorations significatives.

Notre Proposition

Un des plus gros défis en pub digitale, c'est de créer des pubs qui se connectent avec un large éventail d'intérêts des utilisateurs. L'aspect créatif des pubs influence énormément comment les utilisateurs interagissent avec elles, rendant le contenu personnalisé essentiel pour réussir. Bien que les méthodes actuelles de création de pubs soient un peu efficaces, elles ratent souvent la cible en ce qui concerne l'adaptation du contenu aux utilisateurs individuels.

Pour combler cette lacune, on propose le concept d'Optimisation Créative Générative (GCO). Cette approche utilise des signaux sur les intérêts des utilisateurs pour guider la création de visuels personnalisés pour les pubs. On présente AdBooster, un modèle qui génère des visuels de pub en utilisant la technique d'outpainting de diffusion stable. AdBooster se distingue en intégrant les intérêts individuels des utilisateurs pendant les phases d'entraînement et de génération, garantissant que les visuels sont adaptés aux préférences de chaque utilisateur. C'est un pas significatif pour la personnalisation des pubs.

En plus, on inclut un processus de données automatisé innovant pour renforcer la performance d'AdBooster. Ce processus alimente la phase d'entraînement d'AdBooster, ajoutant une couche supplémentaire d'optimisation à la création des visuels.

On a mené plusieurs tests pour valider notre approche. Les résultats ont révélé que les visuels générés par AdBooster étaient plus pertinents que les images de produits standards, ce qui a conduit à un meilleur engagement des utilisateurs.

Travaux Connexes

L'optimisation créative est restée sous-explorée dans le domaine de l'apprentissage machine, souvent éclipsée par les études approfondies sur les systèmes de recommandation. Le but de l'optimisation créative est de gérer comment un article recommandé est présenté, ce qui est crucial pour l'interaction des utilisateurs.

La méthode des Bandits Multi-brins Contextuels est couramment utilisée dans l'optimisation créative lorsqu'il y a peu d'options. Cette méthode équilibre entre tester de nouvelles idées et trouver ce qui fonctionne le mieux.

Les avancées récentes dans la génération d'images et de textes ont ouvert de nouvelles possibilités pour la création de pubs personnalisées. Ces nouveaux modèles, comme la diffusion stable, peuvent créer des images qui semblent remarquablement réalistes basées sur des descriptions écrites. Ça offre une nouvelle chance à l'optimisation créative des pubs d'évoluer et de fonctionner plus efficacement avec les recommandations.

Les modèles de diffusion, inspirés par des concepts de physique, ont été adaptés en formes plus simples qui sont plus faciles à mettre en œuvre. Ces modèles ont montré des résultats impressionnants dans la génération d'images, mais ils ont rencontré des défis, comme des vitesses de génération lentes et de fortes demandes en ressources pour l'entraînement.

Notre travail essaie de tirer parti de ces nouveaux développements en IA générative pour créer des pubs personnalisées, particulièrement dans les secteurs de la mode et du commerce de détail, qui font face à des défis uniques. Les systèmes créatifs de pub doivent gérer des scènes de mode diverses et des arrière-plans tout en s'assurant que tous les éléments des visuels s'intègrent naturellement.

L'Approche

Dans cette section, on explique notre méthode pour connecter la recommandation et l'optimisation créative à travers l'Optimisation Créative Générative. Ça utilise des modèles avancés pour créer des images basées sur des descriptions textuelles.

Définition du Problème

Pour mieux comprendre comment notre approche fonctionne, on va d'abord définir les objectifs habituels de la recommandation et de l'optimisation créative séparément.

Dans les tâches de recommandation, le but est de fournir aux utilisateurs des articles qu'ils aimeraient voir en fonction de leurs intérêts. Les résultats sont généralement mesurés par des interactions utilisateurs comme des clics ou des achats.

L'optimisation créative, en revanche, concerne le choix des meilleurs visuels pour les produits présentés. En pratique, l'optimisation créative implique souvent de tester différentes images pour voir laquelle fonctionne le mieux avec des groupes d'utilisateurs spécifiques.

Les méthodes traditionnelles traitent avec un ensemble limité d'images pour chaque produit, alors que notre approche permet un nombre infini d'options créatives en générant des images. Ça transforme l'optimisation créative d'une tâche avec des choix fixes à une tâche qui peut évoluer en continu.

Optimisation Créative Générative utilisant l'Outpainting de Diffusion Stable

On se concentre sur le problème spécifique de générer des visuels pour des pubs en utilisant le modèle d'outpainting de diffusion stable. Ce modèle peut créer et améliorer des images basées sur des prompts textuels et les intérêts des utilisateurs.

On vérifie à quel point la génération d'images personnalisées fonctionne quand elle reflète le contexte complet de l'utilisateur par rapport aux approches standards. Le but est d'indiquer que la qualité des images générées s'améliore fortement quand elles sont adaptées aux préférences des utilisateurs.

Ajustement pour la Génération Créative d'Annonces

L'efficacité d'AdBooster dépend de l'ajustement réussi de la diffusion stable pour gérer la génération créative de pubs. Comme la diffusion stable est initialement conçue pour des zones plus petites, on a dû l'adapter pour des régions plus vastes sans altérer l'image de produit de base.

Le processus d'ajustement met à jour seulement certaines parties du modèle tout en maintenant d'autres pour préserver ses capacités originales. On a besoin d'un fort ensemble de données d'images avec des masques et des légendes pour bien ajuster. Cependant, de tels ensembles de données sont souvent rares.

Pour surmonter ce problème, on a conçu un processus d'augmentation de données pour générer les masques et prompts de produits nécessaires à partir d'images existantes. Ce processus consiste à nettoyer l'ensemble de données, extraire les masques de produits, et générer des prompts textuels correspondants en utilisant de nouvelles techniques d'apprentissage machine.

De plus, on peut ajouter des règles spécifiques à la fonction de perte du modèle pour l'empêcher de changer les images de produit pendant la génération. Cependant, d'après notre expérience, il s'est avéré efficace de simplement ajuster avec les données augmentées.

Représentation des Utilisateurs et Stratégies de Prompting

Pour examiner comment la personnalisation affecte les utilisateurs, on a d'abord besoin d'une représentation claire de l'utilisateur. On définit un utilisateur en termes de sa requête de produit et de son contexte. Par exemple, un utilisateur pourrait chercher des "chaussures rouges" pour un "mariage".

Dans notre cadre, on crée une nouvelle image basée soit sur la représentation explicite de l'utilisateur, soit à travers des prompts générés par un modèle de langage qui prend en compte le produit recommandé et le contexte de l'utilisateur.

Configuration Expérimentale

Pour tester nos idées, on a conçu une configuration structurée :

  1. On a sélectionné un ensemble de données ouvert de produits incluant des images et des descriptions.
  2. On a créé des représentations utilisateur artificielles en combinant des requêtes de produits avec des contextes.
  3. On a formé un ensemble synthétique de paires utilisateur-produit en associant les utilisateurs avec des produits similaires basés sur leurs descriptions.

Baselines

Dans nos expériences, on a comparé les visuels générés avec les images de produits standards, qui présentent généralement le produit sur un fond uni. On a aussi évalué par rapport à une seconde baseline présentant les produits dans leurs contextes originaux.

Métriques de Performance

Pour comparer nos méthodes avec les baselines, on évalue les réactions des utilisateurs aux visuels des produits. On cherche à déterminer à quel point les utilisateurs sont susceptibles d'acheter des articles en fonction des images qu'ils voient.

Résultats Expérimentaux

On a réalisé des tests pour comparer la performance de notre approche GCO par rapport aux deux baselines. Pour chaque test, on a généré différentes images et sélectionné celle qui performait le mieux en fonction des signaux d'intérêt des utilisateurs.

Les résultats ont souligné que les visuels créés grâce à notre approche surpassaient les méthodes traditionnelles. En particulier, le modèle AdBooster a produit des images qui résonnaient mieux avec les utilisateurs, menant à un engagement plus fort.

Analyse Qualitative

D'un point de vue visuel, il semble que notre modèle aligne les arrière-plans des images générées plus étroitement avec les intérêts des utilisateurs que les images standards. Cela suggère que les utilisateurs sont plus susceptibles d'interagir avec les pubs produites par la méthode GCO.

Défis Rencontrés

Malgré les résultats positifs, on a rencontré certains défis pendant notre étude. Parfois, les générations d'images souffraient de problèmes comme des visuels répétés, des incohérences dans l'éclairage, et des difficultés à représenter les gens de manière réaliste.

À l'avenir, on vise à améliorer les capacités de notre modèle en testant des versions plus avancées de nos techniques qui promettent une meilleure qualité d'image et de détails.

Conclusion

On a fait des progrès significatifs dans la création de visuels de pub personnalisés en développant l'Optimisation Créative Générative (GCO). Notre modèle, AdBooster, montre l'utilisation efficace des intérêts des utilisateurs pour générer des pubs personnalisées. L'intégration de processus de données automatisés renforce la robustesse globale du modèle.

En alignant nos stratégies de recommandation et d'optimisation créative, on a créé une synergie efficace qui améliore la performance de la pub digitale. Grâce à des expérimentations approfondies, on a démontré que les visuels générés par AdBooster sont plus pertinents et engageants que les images standards.

Dans l'ensemble, notre travail présente une direction prometteuse pour la recherche future dans la pub digitale. On prévoit de peaufiner nos méthodes, d'incorporer des retours d'utilisateurs réels, et d'explorer des architectures avancées pour une meilleure flexibilité de génération et qualité.

Source originale

Titre: AdBooster: Personalized Ad Creative Generation using Stable Diffusion Outpainting

Résumé: In digital advertising, the selection of the optimal item (recommendation) and its best creative presentation (creative optimization) have traditionally been considered separate disciplines. However, both contribute significantly to user satisfaction, underpinning our assumption that it relies on both an item's relevance and its presentation, particularly in the case of visual creatives. In response, we introduce the task of {\itshape Generative Creative Optimization (GCO)}, which proposes the use of generative models for creative generation that incorporate user interests, and {\itshape AdBooster}, a model for personalized ad creatives based on the Stable Diffusion outpainting architecture. This model uniquely incorporates user interests both during fine-tuning and at generation time. To further improve AdBooster's performance, we also introduce an automated data augmentation pipeline. Through our experiments on simulated data, we validate AdBooster's effectiveness in generating more relevant creatives than default product images, showing its potential of enhancing user engagement.

Auteurs: Veronika Shilova, Ludovic Dos Santos, Flavian Vasile, Gaëtan Racic, Ugo Tanielian

Dernière mise à jour: 2023-09-08 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.11507

Source PDF: https://arxiv.org/pdf/2309.11507

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires