Un nouveau système pour échanger des prompts d'images
Présentation d'un marché plus équitable pour les prompts de génération d'images à partir de texte.
― 8 min lire
Table des matières
Ces dernières années, la technologie a permis aux gens de créer des visuels à partir de descriptions textuelles grâce à divers modèles. Ça a mené au développement d'un nouveau marché où les utilisateurs peuvent acheter ces prompts textuels, qui facilitent ensuite la génération d'images. Cependant, le processus pour trouver des prompts efficaces et évaluer les images résultantes peut être chiant et coûteux.
Cet article parle d'un nouveau système pour échanger ces prompts, appelé le système de Commerce de Paquets de Prompts (PBT). Ce système propose un Modèle de tarification qui profite aux consommateurs, aux plateformes et aux vendeurs. L’objectif est de créer un environnement de trading plus équitable et flexible.
L'essor de la génération d'images à partir de texte
L'introduction des modèles de génération d'images à partir de texte a transformé la façon dont les visuels sont créés. Avec les bons prompts, les utilisateurs peuvent générer des images qui correspondent à leurs spécifications. Pourtant, obtenir des images de haute qualité demande beaucoup de temps pour rechercher et peaufiner les prompts. L'impact flou de chaque modificateur complique encore les choses, rendant le processus coûteux.
Par exemple, un logo pour un projet a été créé via une plateforme payante, coûtant environ 30 $ pour une seule utilisation. Cette situation a donné naissance à des ingénieurs de prompts, qui se spécialisent dans l'écriture de prompts efficaces. Ils ont commencé à vendre leurs créations sur différentes plateformes, permettant aux consommateurs de parcourir et d'acheter des prompts qui répondent à leurs besoins.
Les prompts sur ces plateformes varient en prix. Par exemple, certains prompts coûtent autour de 3 à 7 $, tandis que d'autres peuvent avoir des prix très variables. Une fois qu'un client achète un prompt, il peut soit générer des images similaires, soit modifier le prompt pour créer de nouveaux visuels dans un style comparable.
Défis dans le trading de prompts
Bien que le trading de prompts semble simple, il est plein de défis. Tout d'abord, les vendeurs fixent unilatéralement les prix de leurs prompts, négligeant souvent l'évaluation de valeur de la plateforme et le point de vue du client. Cette approche de tarification donne aux vendeurs un pouvoir significatif, ce qui contredit le principe de prioriser les besoins du consommateur.
En plus, le partage des revenus entre les plateformes et les vendeurs est généralement fixe, pas ajusté en fonction de la qualité du produit ou de la demande. Ce manque de flexibilité ne favorise pas les intérêts de toutes les parties impliquées dans le processus de trading.
Le scénario PBT
Dans le système PBT, les vendeurs téléchargent leurs prompts sur une plateforme, fixant leurs prix. Les acheteurs intéressés peuvent parcourir et acheter des prompts après avoir vu des images d'exemple. La plateforme récupère une partie des ventes pour ses services, tandis que le reste va au vendeur.
Avec de nombreux types de prompts disponibles, les acheteurs préfèrent souvent des vendeurs réputés. La plateforme peut recommander des paquets de prompts, permettant aux acheteurs d'acheter plusieurs prompts à un prix réduit. Une question importante se pose : comment maximiser les intérêts de toutes les parties ?
Défis dans le système PBT
Il y a deux principaux défis dans la mise en œuvre du système PBT. Le premier défi est de sélectionner des catégories de haute qualité pour les recommandations. Cela nécessite un processus de prise de décision continu, où la plateforme doit apprendre sur la qualité des catégories et appliquer ce savoir de manière stratégique.
Le second défi consiste à créer une stratégie d'incitation pour tous les participants. Les actions de chaque groupe peuvent affecter les profits des autres, créant un besoin d'une approche coopérative pour maximiser les bénéfices.
Mécanisme de tarification et stratégies
Pour relever ces défis, nous introduisons un mécanisme de tarification basé sur une combinaison de deux modèles : le Bandit Multi-Armé Combinatoire (CMAB) et le jeu de Stackelberg Hiérarchique à trois niveaux (HS).
Sélection de catégorie via CMAB
La première partie du mécanisme PBT consiste à sélectionner des catégories inconnues. Ce processus peut être vu comme un problème de bandit multi-armé, où différentes catégories sont comme des bras, et leur qualité correspond aux récompenses potentielles.
Une politique de recherche avide peut être utilisée ici, où la plateforme met continuellement à jour sa connaissance de la qualité des catégories en fonction des sélections passées. Cet approche itérative vise à déterminer les catégories qui produisent la meilleure qualité au fil du temps.
Stratégie d'incitation via le jeu HS
Le deuxième aspect du mécanisme PBT consiste à développer la meilleure stratégie d'incitation pour les trois parties : le consommateur, la plateforme et le vendeur. Les décisions de chaque groupe influencent les autres, nécessitant une approche équilibrée pour garantir que les profits de chacun soient maximisés.
Dans cette structure, le consommateur est le leader de premier niveau, la plateforme est le leader de deuxième niveau, et le vendeur suit. En utilisant une déduction inverse, les meilleures stratégies pour chaque participant peuvent être calculées.
Test expérimental et résultats
Pour valider notre mécanisme PBT, des expériences ont été réalisées en utilisant des ensembles de données simulés inspirés de modèles existants. Ces expériences se sont concentrées sur des domaines clés tels que la génération de revenus, l'adoption de stratégies et la distribution globale des bénéfices parmi les parties impliquées dans le trading.
Construction de l'ensemble de données
L'ensemble de données a été construit en utilisant divers modèles de génération d'images à partir de texte populaires. Des légendes d'un ensemble de données bien connu ont été utilisées comme prompts, résultant en de nombreux paires prompt-image couvrant plusieurs catégories. L'objectif était d'évaluer efficacement la performance du mécanisme PBT.
Évaluation de la sélection de catégories
Différents algorithmes ont été testés pour comparer leur efficacité à sélectionner des catégories de haute qualité. L'approche basée sur la recherche avide s'est avérée être la plus efficace, générant des revenus totaux plus élevés au fil du temps comparé à une sélection aléatoire ou d'autres algorithmes existants.
Analyse des stratégies d'incitation
Ensuite, la performance de la stratégie d'incitation a été analysée. Les résultats ont montré que les décisions de tarification de la plateforme avaient un impact significatif sur les profits des consommateurs et des vendeurs. À mesure que la plateforme augmentait les prix pour maximiser ses revenus, les bénéfices globaux des vendeurs et des consommateurs s'ajustaient en conséquence.
Conclusion
Le mécanisme PBT présente une approche flexible et efficace pour le trading de prompts. En intégrant à la fois la sélection de catégories et les stratégies d'incitation, le système vise à créer un environnement équilibré qui profite à toutes les parties impliquées : consommateurs, plateformes et vendeurs.
Cette approche innovante du trading de prompts offre un modèle de tarification plus réfléchi comparé aux méthodes existantes. Elle vise à favoriser un meilleur environnement de trading pour tous les participants, menant finalement à un marché plus robuste pour la génération d'images basée sur des prompts.
Travaux futurs
Pour l'avenir, il y a plusieurs domaines à améliorer. Des recherches supplémentaires pourraient explorer les implications des données réelles et les dynamiques variées au sein des différentes plateformes de trading de prompts. De plus, le potentiel d'intégrer des systèmes automatisés pour l'évaluation des prompts pourrait améliorer l'efficacité et l'expérience utilisateur.
En conclusion, notre travail sur le système de Commerce de Paquets de Prompts fournit des aperçus précieux et des solutions pratiques aux défis rencontrés dans les marchés de prompts. En répondant aux besoins de toutes les parties prenantes, nous espérons contribuer à un écosystème florissant pour le trading et la génération de prompts.
Titre: Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game
Résumé: Generation models have shown promising performance in various tasks, making trading around machine learning models possible. In this paper, we aim at a novel prompt trading scenario, prompt bundle trading (PBT) system, and propose an online pricing mechanism. Based on the combinatorial multi-armed bandit (CMAB) and three-stage hierarchical Stackelburg (HS) game, our pricing mechanism considers the profits of the consumer, platform, and seller, simultaneously achieving the profit satisfaction of these three participants. We break down the pricing issue into two steps, namely unknown category selection and incentive strategy optimization. The former step is to select a set of categories with the highest qualities, and the latter is to derive the optimal strategy for each participant based on the chosen categories. Unlike the existing fixed pricing mode, the PBT pricing mechanism we propose is more flexible and diverse, which is more in accord with the transaction needs of real-world scenarios. We test our method on a simulated text-to-image dataset. The experimental results demonstrate the effectiveness of our algorithm, which provides a feasible price-setting standard for the prompt marketplaces.
Auteurs: Meiling Li, Hongrun Ren, Haixu Xiong, Zhenxing Qian, Xinpeng Zhang
Dernière mise à jour: 2024-05-31 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.15154
Source PDF: https://arxiv.org/pdf/2405.15154
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.