Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Informatica e teoria dei giochi# Apprendimento automatico

Massimizzare i ricavi nelle offerte pubblicitarie congiunte

Uno studio sulla pubblicità collaborativa per commercianti e marchi.

Gagan Aggarwal, Ashwinkumar Badanidiyuru, Paul Dütting, Federico Fusco

― 7 leggere min


Ottimizzazione dei RicaviOttimizzazione dei RicaviPubblicitari Congiunticollaborative.nelle offerte pubblicitarieStrategie per massimizzare i profitti
Indice

Nel mondo attuale dello shopping online, vendere pubblicità è simile a vendere articoli in un negozio. Questo articolo esplora come si possa vendere un singolo spazio pubblicitario a due acquirenti che non possono essere tenuti lontani dalla visione dell'annuncio, come un commerciante e un marchio.

Questa situazione si presenta quando sia il commerciante che il marchio desiderano fare un'offerta insieme in un'asta per ottenere una maggiore visibilità per un prodotto, con entrambe le parti che traggono vantaggio dall'annuncio visualizzato. Il compito consiste nel raccogliere le offerte da parte del commerciante e del marchio e decidere come allocare lo spazio pubblicitario e quale pagamento ciascuno dovrebbe fare. Questa configurazione crea una situazione complessa con molte regole su come mantenere le cose eque, in particolare su come dividere i pagamenti.

Ci concentriamo su come creare un meccanismo che incoraggi l'onestà nelle offerte, massimizzando al contempo i ricavi, guardando i metodi utilizzati nel campo dell'apprendimento online. Le sfide che affrontiamo sono significative. Innanzitutto, ci sono innumerevoli modi per strutturare questi meccanismi. In secondo luogo, il legame tra i meccanismi e i loro ricavi non è semplice, rendendo inefficaci i metodi tradizionali per analizzare il problema.

In una situazione in cui il valore dell'annuncio è imprevedibile, miriamo a progettare un metodo di apprendimento che garantisca un certo livello di rammarico, che è la differenza tra i ricavi che abbiamo guadagnato e ciò che il miglior meccanismo possibile avrebbe guadagnato. Il nostro metodo si basa su una strategia che si adatta in base allo spazio dei meccanismi osservati, poiché utilizzare un approccio fisso non raggiunge i nostri obiettivi di ricavi.

Quando esaminiamo scenari in cui i valori sono decisi in anticipo, scopriamo che nessun metodo di apprendimento può fare meglio della metà di ciò che un meccanismo ben strutturato guadagnerebbe dopo il fatto. Approfondiamo quindi un contesto di "avversario fluido", in cui i valori provengono da distribuzioni che variano, ma lo fanno in modo fluido. Qui, possiamo sviluppare un metodo di apprendimento che minimizza il rammarico e opera in modo efficiente.

Immagina una piattaforma di vendita online come Amazon o Alibaba. Questi siti non solo vendono prodotti direttamente, ma permettono anche ad altri di fare pubblicità. Gli annunci spesso benefici sono sia per un marchio, come Nike, che per un commerciante, come Footlocker, che collaborano. Il programma "Collaborative Ads" di Facebook è un esempio di questo concetto, dove marchi e commercianti uniscono le forze per acquistare annunci.

Siamo particolarmente interessati ai casi in cui due parti fanno offerte collaborativamente per uno spazio pubblicitario. Il nostro meccanismo è indirizzato a massimizzare i ricavi mentre raccogliamo le offerte e decidiamo sull'allocazione dell'annuncio. Quando il meccanismo funziona correttamente, determina quanto paga ciascuna parte e assicura che entrambe siano soddisfatte del risultato. Ci riferiamo a questa sfida come il Problema degli Annunci Congiunti.

Quando progettiamo questo tipo di meccanismi, ci imbattiamo in diverse complessità. Se non impostiamo il sistema correttamente, il commerciante o il marchio potrebbero non fare offerte veritiere, portando a risultati indesiderati. Pertanto, il meccanismo deve essere progettato per scoraggiare qualsiasi comportamento disonesto e garantire che entrambi gli acquirenti rivelino le loro valutazioni reali.

Sebbene sappiamo come gestire singoli acquirenti in queste situazioni, abbiamo bisogno di un approccio più basato sui dati quando trattiamo più acquirenti. Pertanto, consideriamo il Problema degli Annunci Congiunti Ripetuti, in cui il nostro meccanismo interagisce con una nuova coppia di agenti a ciascun passo, ciascuno caratterizzato dalla propria disponibilità a pagare.

Ad ogni passo, il nostro meccanismo propone un sistema che incoraggia le offerte veritiere e calcola i ricavi basati sui pagamenti effettuati da entrambi gli agenti. L'obiettivo è ottenere il massimo ricavo possibile mentre misuriamo quanto siamo lontani dal benchmark del miglior meccanismo fisso.

Valutiamo tre diversi modi in cui gli agenti possono determinare i loro valori: il modello avversariale, in cui i valori sono assegnati in modo imprevedibile; il modello stocastico, in cui i valori sono estratti da una distribuzione fissa ma sconosciuta; e il modello fluido, in cui i valori provengono da distribuzioni variabili, ma entro limiti prevedibili.

Nel modello stocastico, sviluppiamo un metodo di apprendimento che raggiunge un limite di rammarico, il che significa che, anche se potremmo non sempre ottenere il ricavo ottimale, possiamo garantire che sia abbastanza vicino a determinate condizioni. Tuttavia, nell'impostazione avversariale, scopriamo che nessun metodo può ottenere costantemente più della metà del ricavo del miglior meccanismo fisso.

Nel scenario dell'avversario fluido, progettiamo un metodo di apprendimento che fornisce un buon limite di rammarico, che si basa su un modo compatto di gestire molti esperti all'interno del nostro framework. Mostriamo anche che nessun metodo può fare meglio di un certo livello di rammarico sia nei Modelli Stocastici che in quelli fluidi, il che riduce le aspettative per questi problemi.

La discussione sopra ruota attorno alla comprensione della meccanica degli spazi di vendita al dettaglio online, specialmente su come gli annunci possano essere commercializzati in modo efficiente quando due acquirenti collaborano. Un aspetto critico è che gli annunci possono contemporaneamente beneficiare diverse parti e creare una dinamica interessante in termini di offerte e pagamenti.

Ad esempio, quando un marchio e un commerciante desiderano entrambi acquistare spazio pubblicitario, coordinano le loro offerte in un ambiente d'asta, creando la necessità di un meccanismo di allocazione efficace. La nostra proposta affronta questo intricato Problema del Meccanismo di Allocazione delle Offerte.

La sfida sta in diversi vincoli di incentivo che sorgono. Senza una strutturazione attenta dell'asta, una delle parti potrebbe cercare di abbassare la propria offerta a scapito dell'altra, creando uno squilibrio. Pertanto, un meccanismo efficace deve prevenire strategicamente entrambe le parti dal presentare offerte troppo basse, assicurandosi che riportino le loro valutazioni reali senza paura di essere sfruttate.

Sebbene il compito di vendita di un singolo bene non escludibile sia ben documentato, spesso si basa su conoscenze pregresse riguardo ai valori degli agenti. Una soluzione più efficace sarebbe un approccio basato sui dati che si evolve nel tempo, adattandosi alle offerte ricevute.

Cerchiamo di creare un meccanismo Compatibile con gli incentivi e massimizzante dei ricavi da una prospettiva di apprendimento. Formalmente, affrontiamo questo attraverso interazioni ripetute con coppie di agenti che si presentano a ciascun passo temporale, rivelando le loro valutazioni per lo spazio pubblicitario. Il meccanismo utilizza una combinazione di strategie dominanti per incoraggiare l'onestà e offerte razionali da entrambe le parti.

Il nostro obiettivo ad ogni passo è massimizzare i ricavi complessivi mentre misuriamo il rammarico, che indica quanto ricavo perdiamo rispetto al miglior meccanismo fisso. Esploriamo tre distinti modelli di valutazione: il modello avversariale, in cui i valori sono predeterminati; il modello stocastico, in cui i valori hanno una distribuzione sconosciuta; e il modello fluido, in cui i valori seguono un pattern non stazionario.

Lo scenario avversariale è il più impegnativo poiché i valori possono essere arbitrari. In questo caso, scopriamo che i meccanismi di apprendimento non possono raggiungere un rammarico sublineare rispetto al miglior meccanismo fisso, rendendo il compito significativamente più difficile.

Per quanto riguarda gli avversari fluidi, progettiamo un algoritmo di apprendimento che raggiunge un'efficienza significativo. La complessità di questo modello ci consente di creare un metodo che minimizza il rammarico pur adattandosi alla natura fluttuante dei valori degli agenti.

Introduciamo anche il concetto di meccanismi ortogonali e sottolineiamo la loro importanza in termini di massimizzazione dei ricavi. Questi meccanismi si basano su regioni di allocazione che possono essere rappresentate da percorsi specifici all'interno di un grafo, fornendo una struttura chiara per il processo decisionale.

In sintesi, compiamo progressi nella comprensione del Problema degli Annunci Congiunti concentrandoci sulla minimizzazione del rammarico attraverso algoritmi di apprendimento efficiente. Questo approccio fornisce spunti su come due parti possano collaborare efficacemente in ambienti d'asta per assicurarsi uno spazio pubblicitario senza sacrificare i ricavi.

Nel complesso, questa ricerca fa luce sulle complessità della pubblicità congiunta e sulle implicazioni pratiche di queste scoperte per il commercio online. Adattando i framework di apprendimento e i meccanismi, apriamo nuove strade per migliorare i modelli di ricavi in contesti pubblicitari collaborativi, assicurando che sia i commercianti che i marchi possano beneficiare dei loro sforzi congiunti.

Continua a migliorare questi metodi richiederà ulteriori esplorazioni di nuovi modelli, garantendo che rimangano adattabili ed efficaci di fronte al paesaggio in continua evoluzione della pubblicità online. Le nostre scoperte pongono le basi per ulteriori ricerche su approcci più sofisticati che potrebbero ulteriormente migliorare la generazione di ricavi in contesti collaborativi, portando infine a risultati migliori per tutte le parti coinvolte.

Fonte originale

Titolo: Selling Joint Ads: A Regret Minimization Perspective

Estratto: Motivated by online retail, we consider the problem of selling one item (e.g., an ad slot) to two non-excludable buyers (say, a merchant and a brand). This problem captures, for example, situations where a merchant and a brand cooperatively bid in an auction to advertise a product, and both benefit from the ad being shown. A mechanism collects bids from the two and decides whether to allocate and which payments the two parties should make. This gives rise to intricate incentive compatibility constraints, e.g., on how to split payments between the two parties. We approach the problem of finding a revenue-maximizing incentive-compatible mechanism from an online learning perspective; this poses significant technical challenges. First, the action space (the class of all possible mechanisms) is huge; second, the function that maps mechanisms to revenue is highly irregular, ruling out standard discretization-based approaches. In the stochastic setting, we design an efficient learning algorithm achieving a regret bound of $O(T^{3/4})$. Our approach is based on an adaptive discretization scheme of the space of mechanisms, as any non-adaptive discretization fails to achieve sublinear regret. In the adversarial setting, we exploit the non-Lipschitzness of the problem to prove a strong negative result, namely that no learning algorithm can achieve more than half of the revenue of the best fixed mechanism in hindsight. We then consider the $\sigma$-smooth adversary; we construct an efficient learning algorithm that achieves a regret bound of $O(T^{2/3})$ and builds on a succinct encoding of exponentially many experts. Finally, we prove that no learning algorithm can achieve less than $\Omega(\sqrt T)$ regret in both the stochastic and the smooth setting, thus narrowing the range where the minimax regret rates for these two problems lie.

Autori: Gagan Aggarwal, Ashwinkumar Badanidiyuru, Paul Dütting, Federico Fusco

Ultimo aggiornamento: 2024-09-12 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2409.07819

Fonte PDF: https://arxiv.org/pdf/2409.07819

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili