Migliorare i test A/B con osservazioni sui trigger
Scopri come le osservazioni di attivazione possono migliorare in modo efficace i risultati dei tuoi test A/B.
Tanmoy Das, Dohyeon Lee, Arnab Sinha
― 5 leggere min
Indice
Nel mondo del business online, le aziende vogliono spesso sapere se un cambiamento che hanno fatto sta davvero facendo la differenza. Per farlo, usano strumenti come il test A/B. È abbastanza semplice: hai due gruppi, il gruppo di controllo che vede la vecchia versione di quello che stai testando, e il gruppo di trattamento che vede la nuova versione. Dopo un po', guardi i risultati per vedere quale versione ha funzionato meglio.
Ma ecco il problema. A volte, i cambiamenti sono così piccoli che è difficile capire se stanno facendo davvero una differenza. Questo perché i risultati possono essere piuttosto confusi, e diventa complicato capire se i cambiamenti stanno funzionando come previsto. Molte volte, le aziende perdono l'opportunità di apportare cambiamenti utili che potrebbero rendere i clienti più soddisfatti perché non sono sicuri che i cambiamenti siano efficaci.
Qui entra in gioco l'idea delle "osservazioni scatenanti". Pensa a questi come a momenti speciali in cui i gruppi di controllo e trattamento mostrano risultati diversi. Quando guardi solo questi momenti, potresti avere un quadro più chiaro di ciò che funziona e di ciò che non funziona. Questo potrebbe aiutare le aziende a implementare cambiamenti che migliorano davvero l'esperienza dei clienti e i loro guadagni.
Osservazioni Scatenanti
Facciamo finta che gestisci un negozio online con un sacco di prodotti. Ogni prodotto potrebbe avere delle immagini che devono essere mostrate in un ordine specifico per attirare l'attenzione dei clienti. Hai un vecchio modo di mostrare queste immagini (il modello di controllo) e un nuovo modo che credi sarà meglio (il modello di trattamento).
Ora, l'esperienza di ogni cliente non sarà diversa; alcuni potrebbero vedere gli stessi risultati da entrambi i modelli. Questi si chiamano osservazioni non scatenanti. Ma poi hai quei momenti in cui i due modelli danno classifiche diverse per le immagini-quella è la tua osservazione scatenante. Se ti concentri solo su questi momenti scatenanti, le tue possibilità di vedere cambiamenti reali possono migliorare.
Conoscenza Completa vs. Conoscenza Parziale
Diverse aziende possono avere difficoltà a individuare tutte le osservazioni scatenanti. Identificare ciascuna può essere come cercare un ago in un pagliaio-richiede tempo e costa. Quindi, cosa puoi fare?
Un'opzione è usare la conoscenza completa, il che significa che conosci ogni singola osservazione scatenante. Questo può darti i risultati più accurati, ma ha un costo. Potresti anche considerare di guardare solo un campione delle tue osservazioni-quella è la tua strategia di conoscenza parziale. Anche se questo metodo è più economico, può portare a qualche pregiudizio nei tuoi risultati, proprio come cercare di indovinare cosa c'è dentro un regalo incartato senza aprirlo prima.
Dimensione del campione
L'Importanza dellaQuando usi la conoscenza parziale, la dimensione del tuo campione è importante. Più grande è il tuo campione, meglio puoi stimare l'intensità scatenante, il che significa che ti avvicini di più ai risultati reali. Se la dimensione del tuo campione è troppo piccola, può portare a indovinare risultati sbagliati, proprio come cercare di indovinare quanti jelly beans ci sono in un barattolo contando solo alcuni.
Vantaggi dell'Utilizzo delle Osservazioni Scatenanti
-
Maggiore Precisione: Concentrandosi sulle osservazioni scatenanti, le aziende possono vedere risultati più chiari. È come pulire gli occhiali; all'improvviso, tutto diventa molto più facile da vedere.
-
Maggiore Significatività Statistica: Quando restringi il tuo focus solo a quei momenti in cui esiste una differenza, è più probabile trovare risultati che contano. Questo potrebbe portare a identificare cambiamenti che migliorano realmente la soddisfazione dei clienti o le vendite.
-
Soluzioni Economiche: Con la conoscenza parziale, le aziende possono risparmiare mentre ottengono comunque informazioni preziose. È come riuscire a comprare un ottimo regalo senza svuotare il portafoglio.
-
Validazione nel Mondo Reale: Quando le aziende usano questi metodi su progetti reali, spesso scoprono che i loro risultati stimati sono più vicini alla realtà rispetto a quando sono andati alla cieca.
Esempio Reale
Immagina che il nostro rivenditore online abbia eseguito un test A/B per un nuovo layout della pagina prodotto. Hanno usato un modello di trattamento che mostrava le immagini in un nuovo ordine. Quando i clienti visitavano la pagina, registravano se il modello di controllo e il modello di trattamento offrivano risultati diversi.
Invece di guardare tutte le visite dei clienti, si sono concentrati sulle osservazioni scatenanti in cui i clienti reagivano in modo diverso. Dopo alcuni test, hanno scoperto che usando solo quelle osservazioni, i loro risultati mostrava una riduzione del 36% dell'incertezza sui loro risultati. I clienti erano più propensi ad apprezzare i cambiamenti, e questo potrebbe potenzialmente aumentare le vendite.
Conclusione
In poche parole, capire le osservazioni scatenanti può aiutare le aziende a dare un senso ai loro test A/B. Concentrandosi su quei momenti chiave in cui i risultati differiscono, possono ottenere informazioni più precise e azionabili. Questo approccio non è solo più intelligente; è anche più leggero sul portafoglio. Quindi, la prossima volta che stai considerando quella nuova funzione o layout di prodotto, ricorda che a volte conviene concentrarsi sui momenti che contano davvero.
Titolo: Improving precision of A/B experiments using trigger intensity
Estratto: In industry, online randomized controlled experiment (a.k.a A/B experiment) is a standard approach to measure the impact of a causal change. These experiments have small treatment effect to reduce the potential blast radius. As a result, these experiments often lack statistical significance due to low signal-to-noise ratio. To improve the precision (or reduce standard error), we introduce the idea of trigger observations where the output of the treatment and the control model are different. We show that the evaluation with full information about trigger observations (full knowledge) improves the precision in comparison to a baseline method. However, detecting all such trigger observations is a costly affair, hence we propose a sampling based evaluation method (partial knowledge) to reduce the cost. The randomness of sampling introduces bias in the estimated outcome. We theoretically analyze this bias and show that the bias is inversely proportional to the number of observations used for sampling. We also compare the proposed evaluation methods using simulation and empirical data. In simulation, evaluation with full knowledge reduces the standard error as much as 85%. In empirical setup, evaluation with partial knowledge reduces the standard error by 36.48%.
Autori: Tanmoy Das, Dohyeon Lee, Arnab Sinha
Ultimo aggiornamento: 2024-11-05 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2411.03530
Fonte PDF: https://arxiv.org/pdf/2411.03530
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.