L'impact de Twitter sur les prix du Bitcoin dévoilé
Cet article examine comment les tweets influencent les mouvements de prix du Bitcoin.
Ashutosh Hathidara, Gaurav Atavale, Suyash Chaudhary
― 7 min lire
Table des matières
- La connexion des réseaux sociaux
- Vue d'ensemble du dataset
- Prétraitement et analyse des données
- Analyse de sentiment : l'humeur des tweets
- Regroupement des tweeters
- Prédire les prix du Bitcoin
- Classification des mouvements de prix
- Principales découvertes de l'analyse
- Conclusion : L'avenir de la prédiction
- Source originale
- Liens de référence
Le Bitcoin est devenu un mot à la mode dans le monde de l'investissement ces dix dernières années. Beaucoup en parlent sur les réseaux sociaux, ce qui a entraîné une explosion de tweets discutant de tout, des tendances du marché aux endorsements de célébrités. Cet article explore la relation fascinante entre ces tweets et les prix du Bitcoin, avec l'objectif de prédire les mouvements de prix futurs basés sur les conversations Twitter. Alors, prépare-toi pour un grand huit alimenté par Twitter à travers le monde du Bitcoin !
La connexion des réseaux sociaux
Les plateformes de réseaux sociaux, surtout Twitter, sont devenues des lieux chauds pour discuter des cryptomonnaies. Quand une célébrité tweete quelque chose sur le Bitcoin, le prix peut changer dramatiquement. Tweeter peut créer une tempête, faisant soit monter soit descendre les prix. Étonnamment, les sentiments exprimés dans ces tweets semblent avoir un impact plus grand sur les prix du Bitcoin que les conditions du marché traditionnelles. Dans cette étude, nous avons analysé ces tweets pour voir s'il y a un moyen de profiter de cette conversation et potentiellement prédire l'avenir du Bitcoin.
Vue d'ensemble du dataset
Pour comprendre cette dynamique, nous avons rassemblé un dataset de tweets liés au Bitcoin depuis Kaggle. Ce dataset contient un énorme 16 millions de tweets faits dans le monde entier, allant de janvier 2016 à mars 2019. La plupart des tweets sont en anglais, ce qui facilite notre analyse. Chaque tweet vient avec des détails supplémentaires, comme le nom d'utilisateur, l'heure, et des métriques d'engagement comme les likes et les retweets. On a décidé de se concentrer sur cette période pour garder notre analyse pertinente et gérable.
Prétraitement et analyse des données
Avant de plonger dans le vif du sujet, on a dû préparer notre dataset. Pense à cette étape comme à nettoyer ta chambre avant d'organiser une fête. On a appliqué la détection de langue et filtré pour garder uniquement les tweets en anglais. Une fois qu'on avait un dataset propre, on a agrégé des fonctionnalités comme les réponses, les likes et les retweets sur une base quotidienne. On a même jeté un œil sur le volume quotidien des tweets pour voir si les gens avaient des jours spécifiques où ils étaient plus susceptibles de tweeter sur le Bitcoin.
Analyse de sentiment : l'humeur des tweets
Maintenant, passons à la partie intéressante—qu'est-ce que les gens disent vraiment sur le Bitcoin ? Pour le découvrir, on a fait une analyse de sentiment. On a nettoyé les tweets pour enlever le bruit comme les liens, les mentions, ou les emojis (même si les emojis ajoutent un peu de flair !). En utilisant plusieurs bibliothèques, on a étiqueté les tweets comme positifs, négatifs ou neutres.
Étonnamment, les résultats ont montré que la plupart des tweets étaient neutres. Environ 90 % d'entre eux ne penchaient ni vers le bonheur ni vers la négativité, mais étaient plutôt informatifs. Seulement environ 7 % des tweets exprimaient des sentiments positifs, tandis qu'à peine 3 % exprimaient des sentiments négatifs. Donc, on dirait que la plupart des gens essaient juste de partager des infos plutôt que de raviver le débat sur le Bitcoin—qui l'aurait cru ?
Regroupement des tweeters
Ensuite, on a décidé de regrouper les tweeters selon leur comportement de tweet. On a cherché des motifs dans les likes, les retweets, et d'autres métriques d'engagement. Cette étape est un peu comme essayer de catégoriser tes amis en "fêtards" et "casaniers". On a utilisé différentes techniques de clustering, y compris K-means, hiérarchique, et DBSCAN.
La méthode K-means était un jeu d'enfant, identifiant facilement trois clusters d'utilisateurs. Cependant, les deux autres méthodes ont eu un peu de mal, ne montrant qu'un seul cluster. Ça pourrait être parce qu'elles n'ont pas pu gérer toutes les données qu'on avait. Donc, on n'a pas vraiment une réponse solide sur les types d'utilisateurs qui existent, mais on a quelques idées !
Prédire les prix du Bitcoin
Après avoir fait nos devoirs, on était prêts à prédire les prix du Bitcoin ! On a utilisé divers modèles de Régression pour anticiper le prix pour le lendemain basé sur l'activité de tweet des jours précédents. Pense à ça comme essayer de prédire si ton resto préféré sera bondé. On a entraîné plusieurs modèles comme la régression linéaire, la régression ridge, et les arbres décisionnels pour voir lequel allait le mieux.
Il s'avère que les modèles plus simples—comme la régression linéaire et ridge—ont bien marché pour prédire les prix. Les modèles basés sur les arbres étaient un peu décevants, surtout lors des tests. C'est comme s'ils étaient tous motivés pour l'entraînement, mais qu'ils n'arrivaient pas à performer le jour J !
Classification des mouvements de prix
Mais on ne s'est pas arrêté là ! On a aussi essayé de classifier si le prix du Bitcoin allait monter ou descendre. Cela impliquait d'utiliser des algorithmes de classification comme KNN, régression logistique, et Random Forest. L'idée est de voir si on pourrait prédire la direction du mouvement des prix—pense à ça comme une prévision météo mais pour les cryptomonnaies.
Le classificateur Random Forest s'est avéré être le plus solide, atteignant un taux de précision de 62 %. Bien que ça ne fasse pas de nous des devins du Bitcoin, ça montre quand même un peu de promesse pour faire des estimations éclairées.
Principales découvertes de l'analyse
-
Volume quotidien des tweets : Le volume de tweets sur le Bitcoin a considérablement augmenté de 2016 à 2019.
-
Tendances de sentiment : La plupart des tweets demeuraient neutres en ton, ce qui indique que beaucoup partagent simplement des informations plutôt que d'exprimer des émotions fortes.
-
Clustering : On a trouvé trois catégories possibles d'utilisateurs basées sur leurs tweets, mais les résultats étaient incohérents entre les différentes méthodes de clustering.
-
Résultats de régression : Les modèles de régression simples ont mieux réussi à prédire les prix du Bitcoin que les modèles plus complexes basés sur les arbres.
-
Résultats de classification : Les classificateurs Random Forest étaient les plus efficaces pour prédire la direction du mouvement des prix du Bitcoin.
Conclusion : L'avenir de la prédiction
Bien que prédire les prix du Bitcoin en utilisant les tweets soit un défi, notre étude montre qu'il existe une connexion entre l'activité des tweets et les changements de prix du Bitcoin. Si on est honnêtes, le marché est un peu comme un jeu de chaises musicales—un moment tu es au top, et le suivant, quelqu'un tweete sur une nouvelle régulation, et tout d'un coup, tu es hors jeu !
Les recherches à venir pourraient améliorer les prédictions en rassemblant plus de données et en explorant de nouvelles fonctionnalités. Peut-être qu'incorporer des infos de comptes vérifiés ou même des tendances Google pourrait aider à affiner nos prévisions.
Au final, cette étude ne te donnera peut-être pas la formule secrète pour devenir millionnaire en Bitcoin, mais elle éclaire sûrement comment les réseaux sociaux peuvent influencer le comportement du marché. Donc, la prochaine fois que quelqu'un tweete sur le Bitcoin, garde un œil sur ces prix—tu ne sais jamais ce qui pourrait se passer ensuite !
Source originale
Titre: Mining Tweets to Predict Future Bitcoin Price
Résumé: Bitcoin has increased investment interests in people during the last decade. We have seen an increase in the number of posts on social media platforms about cryptocurrency, especially Bitcoin. This project focuses on analyzing user tweet data in combination with Bitcoin price data to see the relevance between price fluctuations and the conversation between millions of people on Twitter. This study also exploits this relationship between user tweets and bitcoin prices to predict the future bitcoin price. We are utilizing novel techniques and methods to analyze the data and make price predictions.
Auteurs: Ashutosh Hathidara, Gaurav Atavale, Suyash Chaudhary
Dernière mise à jour: 2024-12-02 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2412.02148
Source PDF: https://arxiv.org/pdf/2412.02148
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.