Migliorare le raccomandazioni con l'augmented item positivo
Un nuovo metodo aumenta l'accuratezza e la varietà dei sistemi di raccomandazione.
― 6 leggere min
Indice
I sistemi di raccomandazione personalizzati aiutano gli utenti a trovare articoli che probabilmente apprezzeranno in base al loro comportamento passato. Però, un problema comune che affrontano questi sistemi è la mancanza di dati sufficienti. Molti utenti potrebbero non interagire con abbastanza articoli affinché il sistema riesca a capire accuratamente le loro preferenze. Questo porta a raccomandazioni scadenti, dato che il sistema fatica a identificare cosa vogliono gli utenti.
Per migliorare le raccomandazioni, è importante creare esempi positivi aggiuntivi di articoli che gli utenti potrebbero gradire. Questo è conosciuto come aumento di articoli positivi. Tuttavia, aggiungere semplicemente più articoli non basta. Il sistema deve garantire che questi articoli aggiunti siano sia accurati che vari per evitare di mostrare ripetutamente lo stesso tipo di contenuto agli utenti.
Il Problema della Scarsità di Dati
In molti sistemi di raccomandazione, gli utenti hanno storie di clic, acquisti o visualizzazioni minime rispetto al vasto numero di articoli disponibili. Ad esempio, considera quanti articoli ci sono su piattaforme come i servizi di streaming o i siti di e-commerce. Gli utenti potrebbero aver interagito solo con una manciata di questi articoli, portando a una comprensione scarsa delle loro reali preferenze. Questa scarsità di dati rende difficile per gli algoritmi di raccomandazione identificare cosa interessa gli utenti.
Per affrontare questo problema, molti ricercatori hanno cercato diversi metodi per aumentare la quantità di feedback positivo utilizzato per l'addestramento. Alcuni approcci attingono informazioni da diverse fonti o considerano anche il comportamento di utenti con interessi simili. Un altro metodo è creare nuovi esempi all'interno dello stesso dataset per migliorare l'addestramento senza necessità di informazioni esterne.
Approccio all'Aumento di Articoli Positivi
Il metodo proposto si concentra sulla creazione di un set di esempi di articoli positivi più preciso e vario. Questo implica raccogliere articoli potenziali da più prospettive. Prima di tutto, il sistema esamina i comportamenti passati di un utente per raccogliere articoli che si allineano sia ai loro interessi a lungo termine che a quelli a breve termine. Questo avviene attraverso tre strategie principali:
- Recupero Utente a Articolo (u2i): Questa strategia raccoglie articoli in base agli interessi complessivi di un utente, considerando il loro comportamento a lungo termine.
- Recupero Articolo a Articolo (i2i): Questo metodo si concentra sugli interessi immediati dell'utente legati direttamente agli articoli con cui hanno interagito.
- Recupero Utente a Utente a Articolo (u2u2i): Questa strategia osserva quali articoli piacciono a utenti simili e raccomanda quegli articoli.
Una volta raccolti questi articoli positivi potenziali, il sistema utilizza un metodo noto come auto-distillazione. Questo è un modo per esaminare e affinare gli articoli selezionati, garantendo che siano di alta qualità e sufficientemente diversi per soddisfare i gusti degli utenti.
Miglioramento delle Raccomandazioni
L'obiettivo è rendere le raccomandazioni più accurate e varie. Quando nuovi articoli positivi vengono introdotti nel processo di addestramento, dovrebbero aiutare il modello a imparare meglio. Raccomandazioni varie possono tenere gli utenti coinvolti e prevenire che si blocchino in un loop di visione dello stesso tipo di contenuto.
Per misurare l'efficacia del sistema proposto, i ricercatori hanno condotto test sia offline (utilizzando dati storici) che online (in situazioni reali). Questo ha incluso un test A/B in cui il nuovo sistema è stato confrontato con i metodi esistenti per vedere se davvero offriva raccomandazioni migliori.
Sperimentazione e Risultati
Nelle valutazioni, il sistema proposto ha mostrato miglioramenti notevoli rispetto ai metodi esistenti. La ricerca è stata condotta utilizzando due ampi dataset. Il primo consisteva in milioni di utenti e articoli, consentendo test accurati in uno scenario reale.
In questi esperimenti, sono state monitorate misure come la frequenza con cui gli utenti cliccavano su articoli raccomandati (click-through rate) e la soddisfazione generale degli utenti. I risultati hanno dimostrato che il nuovo metodo potrebbe aumentare il numero di interazioni positive, mostrando che gli utenti erano più propensi a interagire con gli articoli suggeriti.
Sfruttando le tre strategie di recupero, il sistema è riuscito a raccogliere una vasta gamma di raccomandazioni. I risultati hanno indicato che gli utenti ricevevano un set di suggerimenti più vario rispetto ai metodi tradizionali, che si basavano principalmente su ciò con cui gli utenti avevano precedentemente interagito.
Test Online
Per confermare l'efficacia del metodo, è stato eseguito un test A/B online. In questo test, il nuovo sistema di raccomandazione è stato messo in pratica, permettendo a utenti reali di sperimentare i cambiamenti. Le performance sono state valutate tracciando due metriche principali: il numero medio di visualizzazioni per persona e il tasso di completamento dei video.
I risultati sono stati promettenti. Quando il sistema tradizionale è stato sostituito con il nuovo metodo, sono stati registrati miglioramenti significativi in entrambe le metriche. Questo ha indicato che gli utenti non solo trovavano più contenuti da guardare, ma rimanevano anche più a lungo con il contenuto.
Comprendere la Diversità nelle Raccomandazioni
La diversità nelle raccomandazioni è fondamentale. Questo aiuta a prevenire quelle che sono conosciute come "bolle di filtro", dove gli utenti vedono solo un raggio limitato di contenuti che già conoscono e apprezzano. Il nuovo metodo ha dimostrato di poter fornire una varietà più ampia di articoli agli utenti. Questo è stato validato analizzando quanti articoli distinti sono stati raccomandati rispetto al metodo tradizionale.
Valutando la distintività nelle raccomandazioni, era chiaro che il nuovo approccio forniva oltre tre volte più articoli unici da considerare per gli utenti. Questa varietà può migliorare l'esperienza degli utenti e mantenere alti i livelli di coinvolgimento.
Conclusione e Direzioni Future
L'aumento di articoli positivi è una parte essenziale per migliorare i sistemi di raccomandazione. Combinando metodi per raccogliere un set diverso di raccomandazioni potenziali e raffinando attraverso l'auto-distillazione, questo nuovo approccio ha dimostrato di essere efficace.
Il deployment di questo metodo in sistemi reali indica il suo valore pratico, impattando un gran numero di utenti. Il lavoro futuro si concentrerà sulla creazione di ulteriori modi per migliorare le raccomandazioni di articoli positivi e analizzare come diversi aggiustamenti possano ulteriormente beneficiare gli utenti.
Concentrandosi sul miglioramento sia dell'accuratezza che della diversità, l'obiettivo è creare un sistema di raccomandazione che comprenda davvero e risponda alle preferenze individuali degli utenti, assicurando che rimangano coinvolti e soddisfatti con i contenuti che ricevono.
Titolo: Learning from All Sides: Diversified Positive Augmentation via Self-distillation in Recommendation
Estratto: Personalized recommendation relies on user historical behaviors to provide user-interested items, and thus seriously struggles with the data sparsity issue. A powerful positive item augmentation is beneficial to address the sparsity issue, while few works could jointly consider both the accuracy and diversity of these augmented training labels. In this work, we propose a novel model-agnostic Diversified self-distillation guided positive augmentation (DivSPA) for accurate and diverse positive item augmentations. Specifically, DivSPA first conducts three types of retrieval strategies to collect high-quality and diverse positive item candidates according to users' overall interests, short-term intentions, and similar users. Next, a self-distillation module is conducted to double-check and rerank these candidates as the final positive augmentations. Extensive offline and online evaluations verify the effectiveness of our proposed DivSPA on both accuracy and diversity. DivSPA is simple and effective, which could be conveniently adapted to other base models and systems. Currently, DivSPA has been deployed on multiple widely-used real-world recommender systems.
Autori: Chong Liu, Xiaoyang Liu, Ruobing Xie, Lixin Zhang, Feng Xia, Leyu Lin
Ultimo aggiornamento: 2023-08-15 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2308.07629
Fonte PDF: https://arxiv.org/pdf/2308.07629
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.