Nouveau modèle prédit les dépenses des utilisateurs dans les sports fantasy
Une nouvelle architecture améliore les prévisions des dépenses des utilisateurs sur les plateformes de sports fantaisie.
― 8 min lire
Table des matières
- L'Importance de Prédire la Propension à Dépenser
- Choisir la Bonne Technique de Modélisation
- Développer une Nouvelle Architecture de Modélisation
- Tester Notre Approche
- Performance de Notre Modèle
- Implications pour l'Industrie des Sports Fantasy
- Pourquoi la Nouvelle Architecture Fonctionne Bien
- Conclusion
- Source originale
- Liens de référence
Les sports fantasy ont changé la façon dont les gens s'engagent avec le sport. Des plateformes comme Dream11 permettent aux utilisateurs de créer des équipes virtuelles basées sur des événements sportifs réels. Les utilisateurs peuvent payer pour participer à des concours et gagner de l'argent en fonction de la performance de leurs équipes. Actuellement, il y a plus de 200 millions d'utilisateurs sur ces plateformes. Un aspect clé pour rendre ces plateformes réussies est de comprendre comment les utilisateurs décident de dépenser leur argent pendant les sessions de jeu.
Prédire combien d'argent un utilisateur est prêt à dépenser peut aider à améliorer son expérience globale. En le sachant, la plateforme peut recommander des produits ou offrir des incitations qui correspondent aux habitudes de dépense d'un utilisateur. Pour y parvenir, nous devons analyser les dépenses passées des utilisateurs et leur comportement basés sur une large gamme de données telles que la participation aux sessions de jeu, les montants dépensés, les gains et la démographie des utilisateurs.
L'Importance de Prédire la Propension à Dépenser
Prédire avec précision combien un utilisateur est susceptible de dépenser est crucial pour plusieurs raisons. Ça permet aux plateformes de personnaliser leurs offres de produits, en veillant à ce que les utilisateurs voient les options les plus pertinentes pour eux. En plus, ça permet des promotions ciblées qui peuvent inciter les utilisateurs à s'engager plus avec la plateforme. Avec la concurrence croissante dans le monde du jeu, faire des prédictions éclairées est essentiel pour maintenir l'engagement des utilisateurs et augmenter les profits.
Des modèles capables d'analyser de grands ensembles de données de transactions historiques jouent un rôle clé dans ce processus de prédiction. Ils doivent gérer différents types d'informations, y compris les montants dépensés, l'activité des utilisateurs et même des détails démographiques. Le principal défi est de capturer efficacement les relations complexes entre toutes ces caractéristiques.
Choisir la Bonne Technique de Modélisation
Étant donné les grandes quantités de données complexes, choisir la bonne méthode d'analyse est essentiel. Traditionnellement, des modèles comme les arbres de décision à gradient boosting (GBDT) ont été préférés pour les données structurées. Cependant, au fur et à mesure que les ensembles de données deviennent plus volumineux et complexes, se fier uniquement à des modèles traditionnels peut poser des difficultés. Ces modèles peuvent devenir lents et ne pas exploiter pleinement les données disponibles.
D'un autre côté, les modèles d'Apprentissage profond montrent des promesses dans la reconnaissance de modèles, surtout dans des applications comme la reconnaissance d'images et de la parole. Cependant, ils n'ont pas été largement utilisés pour les Données tabulaires à cause des défis uniques posés par les différents types de caractéristiques impliquées, comme les données continues, catégorielles et ordinales.
Pour améliorer les performances, nous avons besoin d'approches innovantes qui peuvent traiter ces défis. Par exemple, les avancées récentes dans les modèles basés sur l'attention commencent à fournir de meilleurs cadres pour comprendre les relations dans les données tabulaires.
Développer une Nouvelle Architecture de Modélisation
En réponse aux défis mentionnés, nous proposons une nouvelle architecture qui améliore la façon dont les modèles d'apprentissage profond interagissent avec les caractéristiques d'entrée. Ce nouveau design se concentre sur une meilleure capture des relations entre différentes caractéristiques, permettant des prévisions plus précises sur les dépenses des utilisateurs.
Notre architecture améliore la généralisation en formant des modèles qui prennent en compte comment les caractéristiques se rapportent les unes aux autres. Cela signifie qu'au lieu de traiter chaque caractéristique individuellement, le modèle apprend des connexions et des relations entre elles. En se concentrant sur ces connexions, nous pouvons créer une image plus précise du comportement de dépense des utilisateurs.
Tester Notre Approche
Pour tester notre nouveau modèle, nous le comparons avec d'autres types de modèles spécifiquement conçus pour les données tabulaires. Cela inclut des approches traditionnelles comme les perceptrons multicouches (MLP), des réseaux plus profonds et des modèles de transformateurs spécialisés. Nous analysons ces modèles en utilisant des ensembles de données typiques du domaine des sports fantasy, qui se composent de millions d'entrées et de diverses caractéristiques.
Lors de nos expériences, nous mesurons deux indicateurs principaux : l'erreur absolue moyenne (MAE) et l'erreur quadratique moyenne (MSE). Ces métriques nous aident à déterminer à quel point notre modèle prédit avec précision le comportement de dépense des utilisateurs par rapport à d'autres modèles.
Performance de Notre Modèle
Les résultats de nos tests montrent que notre nouvelle architecture surpasse systématiquement les autres modèles. Elle obtient la meilleure précision et constance lors de la prévision des montants de dépense des utilisateurs. Notamment, elle se révèle meilleure que les modèles de pointe précédents, indiquant sa force dans ce domaine.
Les modèles GBDT traditionnels, bien qu’habituellement utilisés, n'ont pas aussi bien performé lors de nos expériences. Les résultats suggèrent que la nouvelle approche capture efficacement les relations complexes dans les données, ce qui est crucial pour faire des prévisions précises.
Implications pour l'Industrie des Sports Fantasy
La capacité de prédire avec précision combien un utilisateur est prêt à dépenser a des avantages concrets. Pour des plateformes comme Dream11, cela signifie des techniques de vente incitative plus efficaces et des suggestions de produits adaptées. Quand les utilisateurs voient des options qui correspondent étroitement à leurs intérêts et habitudes de dépense, ils sont plus susceptibles de s'engager davantage et de revenir sur la plateforme.
En plus, avec la capacité de gérer de grands et complexes ensembles de données, notre modèle peut évoluer avec l'augmentation des bases d'utilisateurs et la variété croissante des types de données. Cette adaptabilité sera essentielle alors que l'industrie des sports fantasy continue de croître et d'évoluer.
Pourquoi la Nouvelle Architecture Fonctionne Bien
Notre nouvelle architecture se distingue pour plusieurs raisons. Elle gère efficacement une gamme de types de caractéristiques, atténuant les problèmes souvent rencontrés avec des caractéristiques peu informatives. Beaucoup de caractéristiques dans les ensembles de données tabulaires peuvent être non pertinentes, conduisant à une mauvaise performance du modèle. Cependant, notre design permet au modèle de se concentrer sur les informations pertinentes.
Une autre raison de son succès est la façon dont elle gère la complexité des échantillons dans les données. En intégrant des mécanismes qui réduisent l'impact des informations non pertinentes dès le début du processus, on réduit la complexité et améliore la performance.
De plus, l'utilisation de couches d'embedding est un facteur crucial. Ces couches aident à améliorer la façon dont le modèle gère les données en brisant l'invariance rotationnelle et permettant de meilleures adaptations à la structure des données tabulaires.
Conclusion
Dans notre étude, nous avons développé une nouvelle architecture d'apprentissage profond spécifiquement conçue pour prédire les dépenses des utilisateurs dans des ensembles de données tabulaires. En se concentrant sur les relations entre différentes caractéristiques, notre modèle a montré des performances supérieures par rapport aux modèles existants. Alors que les plateformes de sports fantasy continuent de croître et de rassembler plus de données, la capacité à faire des prédictions de dépenses précises est essentielle pour améliorer l'engagement des utilisateurs et garantir la rentabilité.
À travers notre recherche, nous visons à inspirer d'autres études dans l'apprentissage profond pour les données tabulaires. Explorer des modèles hybrides qui combinent les forces de l'apprentissage profond et des méthodes traditionnelles pourrait donner encore de meilleurs résultats à l'avenir. La mise en œuvre du Transformateur Contextuel Sensible à la Proximité dans des scénarios réels fournira également des informations précieuses sur son efficacité et sur les améliorations possibles.
Titre: Efficient Feature Interactions with Transformers: Improving User Spending Propensity Predictions in Gaming
Résumé: Dream11 is a fantasy sports platform that allows users to create their own virtual teams for real-life sports events. We host multiple sports and matches for our 200M+ user base. In this RMG (real money gaming) setting, users pay an entry amount to participate in various contest products that we provide to users. In our current work, we discuss the problem of predicting the user's propensity to spend in a gaming round, so it can be utilized for various downstream applications. e.g. Upselling users by incentivizing them marginally as per their spending propensity, or personalizing the product listing based on the user's propensity to spend. We aim to model the spending propensity of each user based on past transaction data. In this paper, we benchmark tree-based and deep-learning models that show good results on structured data, and we propose a new architecture change that is specifically designed to capture the rich interactions among the input features. We show that our proposed architecture outperforms the existing models on the task of predicting the user's propensity to spend in a gaming round. Our new transformer model surpasses the state-of-the-art FT-Transformer, improving MAE by 2.5\% and MSE by 21.8\%.
Auteurs: Ved Prakash, Kartavya Kothari
Dernière mise à jour: 2024-09-25 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2409.17077
Source PDF: https://arxiv.org/pdf/2409.17077
Licence: https://creativecommons.org/publicdomain/zero/1.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.