Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico# Basi di dati# Recupero delle informazioni

Prevedere i Ritorni nel Moda Online

Un nuovo dataset aiuta a prevedere i resi degli articoli per strategie di vendita al dettaglio migliori.

― 6 leggere min


Previsione dei resi nelPrevisione dei resi nelretail della modaarticoli in modo efficace.Usare i dati per prevedere i resi degli
Indice

Molti negozi di moda online permettono ai Clienti di restituire articoli con pochi o addirittura nessun costo. Tuttavia, questo processo può portare a costi di spedizione aggiuntivi e avere un impatto negativo sull'ambiente. Con sempre più rivenditori di moda che vogliono ridurre il loro effetto sul pianeta, è importante trovare modi per prevedere quali articoli i clienti potrebbero restituire prima di fare un acquisto. Questo aiuta i rivenditori a pianificare meglio e aiuta i clienti a trovare ciò che vogliono.

Con la crescita dell'e-commerce, è fondamentale per le aziende utilizzare dati per comprendere le preferenze dei clienti. Questa comprensione plasma l'esperienza di acquisto. Un metodo promettente implica l'uso di tecniche avanzate per apprendere modelli nei dati. Tuttavia, non ci sono molti dataset disponibili che includano informazioni sui clienti e sui prodotti, il che rende difficile questo tipo di ricerca.

I rivenditori di moda hanno un'opportunità unica di aiutare condividendo dati che possono supportare la ricerca nel machine learning. Uno degli interessi principali di ASOS, un grande rivenditore di moda online, è utilizzare tecniche di machine learning per prevedere i Resi. Per contribuire, ASOS ha creato un nuovo dataset chiamato GraphReturns. Questo dataset contiene relazioni tra clienti e prodotti, rendendolo adatto per tecniche di analisi dei dati avanzate.

Panoramica del Dataset

Il dataset GraphReturns include acquisti e resi effettuati dai clienti ASOS da settembre a ottobre 2021. Contiene dettagli sui clienti, le varianti di Prodotto (inclusi differenze di taglia e colore) e eventi come acquisti o resi. L'ID di ogni cliente è anonimizzato per mantenere private le loro informazioni.

In questo dataset, ci sono voci uniche per clienti e varianti di prodotto. Ogni cliente ha restituito almeno un articolo e ogni variante di prodotto è stata acquistata almeno una volta. Il dataset contiene oltre 1,4 milioni di eventi di acquisto, ciascuno etichettato come reso o non reso. Questa impostazione definisce il compito di prevedere i resi come un problema di classificazione.

Il formato di base dei dati prevede il collegamento tra clienti e prodotti sulla base delle azioni di acquisto. I collegamenti sono etichettati per indicare se gli articoli sono stati restituiti o meno. Ulteriori informazioni per clienti e prodotti sono incluse, come tassi di reso medi e motivi per i resi.

Il dataset offre spunti su come il comportamento dei clienti e le caratteristiche dei prodotti si relazionano ai tassi di reso. Ad esempio, alcune tendenze mostrano che i clienti maschi potrebbero restituire meno articoli rispetto ai clienti femmine, o che i prodotti più costosi tendono ad avere tassi di reso più elevati. Queste statistiche possono aiutare i modelli di machine learning a fare previsioni migliori sui resi dei clienti.

Struttura del Grafo

Una delle caratteristiche uniche del dataset GraphReturns è la sua struttura a grafo intrinseca. Collegare clienti e prodotti crea una rete di relazioni che può essere analizzata ulteriormente. Questa struttura a grafo facilita l'applicazione di tecniche avanzate per analizzare i dati.

Oltre ai nodi clienti e prodotti, il dataset include nodi virtuali che rappresentano tipi di prodotto, marchi e motivi per i resi. Queste connessioni aggiuntive consentono un'analisi più complessa del comportamento dei clienti nel contesto dell'industria della moda.

L'idea è di costruire un grafo dove ogni nodo rappresenta diverse entità, come clienti o prodotti, e i bordi rappresentano le loro relazioni. Organizzare i dati in questo modo consente ai modelli di machine learning di comprendere meglio i modelli e fare previsioni.

Metodologia

Per testare l'efficacia di questo dataset, sono stati utilizzati diversi modelli per prevedere i resi dei clienti. È stata applicata una gamma di metodi, inclusi approcci tradizionali come la regressione logistica e le foreste casuali, così come tecniche avanzate come le reti neurali a grafo (GNN).

I modelli tradizionali sono stati addestrati direttamente sui dati grezzi, mentre le GNN hanno beneficiato della struttura a grafo del dataset. Le GNN funzionano apprendendo dai collegamenti tra i nodi, rendendole particolarmente adatte per questo tipo di dati. Possono generalizzare meglio, consentendo loro di prevedere risultati per nuovi clienti e prodotti che non sono stati mai visti prima.

Il dataset è stato strutturato con attenzione per garantire esempi di addestramento significativi. Ad esempio, sono stati utilizzati solo eventi di acquisto con un chiaro modello di reso per aiutare il modello a imparare in modo efficace. Questo aiuta a produrre previsioni migliori fornendo al modello esempi chiari di articoli che tendono ad essere restituiti e quelli che non lo sono.

Risultati

Dopo aver applicato vari modelli al dataset, i risultati hanno mostrato che le GNN hanno superato i metodi tradizionali di machine learning. La GNN ha raggiunto un punteggio F1 elevato, che indica la sua capacità di fare previsioni corrette, oltre a un tasso di errore inferiore rispetto ad altri modelli.

Analizzando i risultati per singoli paesi, la GNN ha funzionato bene in diversi mercati, suggerendo che è capace di adattarsi a vari comportamenti dei clienti in base alla posizione geografica. Questo spunto può aiutare i rivenditori di moda a personalizzare i propri servizi in modo efficace per specifiche regioni.

La capacità di analizzare le previsioni in base a paese, tipo di prodotto o marchio fornisce ai rivenditori spunti preziosi sul comportamento dei clienti. Questo può aiutare le aziende a migliorare le proprie strategie e aumentare la soddisfazione del cliente.

Conclusione

Il dataset GraphReturns rappresenta un'opportunità significativa per la ricerca nel retail della moda. È progettato per supportare tecniche di analisi avanzate e ha una struttura ricca che si presta a migliori previsioni sui resi dei clienti.

Le prestazioni delle GNN utilizzando questo dataset indicano che i metodi basati su grafo possono fornire risultati migliori rispetto agli approcci tradizionali. I risultati mostrano che le GNN possono prevedere i resi con maggiore precisione, consentendo ai rivenditori di pianificare meglio e ridurre costi non necessari.

Analizzando il comportamento dei clienti attraverso questo dataset, le aziende possono capire meglio come servire i propri clienti e minimizzare il loro impatto ambientale. Con la crescita dell'e-commerce, sfruttare questi dataset diventerà sempre più importante. C'è potenziale per ricerche future per esplorare ulteriormente come i metodi basati su grafo possano innovare i sistemi di raccomandazione e migliorare la sostenibilità nell'industria della moda.

Fonte originale

Titolo: A Dataset for Learning Graph Representations to Predict Customer Returns in Fashion Retail

Estratto: We present a novel dataset collected by ASOS (a major online fashion retailer) to address the challenge of predicting customer returns in a fashion retail ecosystem. With the release of this substantial dataset we hope to motivate further collaboration between research communities and the fashion industry. We first explore the structure of this dataset with a focus on the application of Graph Representation Learning in order to exploit the natural data structure and provide statistical insights into particular features within the data. In addition to this, we show examples of a return prediction classification task with a selection of baseline models (i.e. with no intermediate representation learning step) and a graph representation based model. We show that in a downstream return prediction classification task, an F1-score of 0.792 can be found using a Graph Neural Network (GNN), improving upon other models discussed in this work. Alongside this increased F1-score, we also present a lower cross-entropy loss by recasting the data into a graph structure, indicating more robust predictions from a GNN based solution. These results provide evidence that GNNs could provide more impactful and usable classifications than other baseline models on the presented dataset and with this motivation, we hope to encourage further research into graph-based approaches using the ASOS GraphReturns dataset.

Autori: Jamie McGowan, Elizabeth Guest, Ziyang Yan, Cong Zheng, Neha Patel, Mason Cusack, Charlie Donaldson, Sofie de Cnudde, Gabriel Facini, Fabon Dzogang

Ultimo aggiornamento: 2023-03-12 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2302.14096

Fonte PDF: https://arxiv.org/pdf/2302.14096

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili