Aperçus sur l'apprentissage automatique dans les marchés financiers
Cette étude explore les applications de l'apprentissage automatique pour prédire les mouvements des marchés financiers.
Gabriel Rodrigues Palma, Mariusz Skoczeń, Phil Maguire
― 7 min lire
Table des matières
- Marchés Financiers et Apprentissage automatique
- Ingénierie des Caractéristiques
- Collecte et Mise en Place des Données
- Extraction des Caractéristiques
- Clustering de Données avec les Modèles de Mélange Gaussien
- Méthodes d'Apprentissage Automatique
- Évaluation de Performance
- Résultats et Discussion
- Conclusion
- Source originale
- Liens de référence
Les traders sur les marchés financiers doivent prendre des décisions pour acheter ou vendre des actifs en se basant sur leurs analyses. Identifier des motifs rentables dans les données du marché est super important pour ces choix. Cet article explore la combinaison de différentes méthodes d'apprentissage pour prédire les mouvements sur les marchés financiers, en se concentrant particulièrement sur les cryptos comme Bitcoin et Pepecoin, ainsi que sur le marché boursier Nasdaq.
Apprentissage automatique
Marchés Financiers etLes marchés financiers sont influencés par les comportements et décisions des traders. Ils analysent divers jeux de données pour trouver des motifs exploitables. Les méthodes d'analyse courantes incluent des indicateurs techniques et des graphiques qui montrent les tendances au fil du temps. Ces dernières années, l'apprentissage automatique est devenu un outil précieux pour prédire les mouvements du marché et guider les décisions de trading.
Les techniques d'apprentissage automatique ont été mises en œuvre dans divers marchés, y compris les cryptos et les marchés boursiers traditionnels. Ces méthodes aident à comprendre les défis de la prévision des tendances de marché futures.
Ingénierie des Caractéristiques
Créer des modèles de prévision des prix efficaces a poussé la recherche à extraire des caractéristiques pertinentes des données financières. Beaucoup d'études passées ont examiné des méthodes de clustering pour comprendre les tendances du marché et les relations entre les actifs. Cette recherche met en avant l'importance de développer des caractéristiques sophistiquées pour capturer efficacement la dynamique du marché.
Dans ce travail, on introduit un nouvel ensemble de caractéristiques basées sur des modèles statistiques qui analysent les pics de prix dans les données financières. Ces caractéristiques sont utilisées pour améliorer les prévisions des mouvements de marché à court terme. On applique aussi des Modèles de Mélange Gaussien (GMM) pour filtrer les données du marché et identifier des scénarios de trading rentables.
Collecte et Mise en Place des Données
On a collecté environ six mois de Données de marché pour Bitcoin et Pepecoin, ainsi que des données de prix minute par minute pour le marché Nasdaq. Les données incluent des détails sur les prix d'ouverture, de clôture, les plus hauts et les plus bas. Un changement en pourcentage des prix est calculé pour créer des données en séries temporelles, permettant d'analyser efficacement les mouvements du marché.
On a classé les décisions de trading en utilisant un algorithme de seuil symétrique. Ça implique de définir certains niveaux dans les données pour décider si le marché doit être classé en achat, vente ou maintien. Les données résultantes reflètent ces décisions sur la période donnée.
Extraction des Caractéristiques
Pour générer de nouvelles caractéristiques pour chaque marché, on a organisé les données de séries temporelles en segments. Pour chaque ensemble d'observations, on a calculé des caractéristiques spécifiques pour aider à prédire les mouvements futurs. Ces caractéristiques incluent les proportions d'actions d'achat et de vente, les prix de clôture, les intercepts et pentes des modèles linéaires ajustés aux pics de prix, et plusieurs valeurs moyennes.
On a aussi comparé ces nouvelles caractéristiques avec des caractéristiques standard communément utilisées dans les stratégies de trading. Celles-ci incluent divers indicateurs et moyennes mobiles qui aident les traders à prendre des décisions éclairées.
Clustering de Données avec les Modèles de Mélange Gaussien
On a appliqué des Modèles de Mélange Gaussien (GMM) pour regrouper des tendances de marché similaires basées sur les caractéristiques extraites. Le nombre de clusters a été déterminé à l'aide du Critère d'Information Bayésien (BIC), choisissant le modèle qui offrait le meilleur ajustement pour les données.
Le clustering GMM permet de catégoriser les données de marché en différents groupes basés sur des caractéristiques partagées. L'analyse de ces clusters aide à identifier des opportunités de profit potentielles en fournissant un aperçu des différents environnements de trading.
Méthodes d'Apprentissage Automatique
Avant d'implémenter des algorithmes d'apprentissage avancés, on a établi une base de référence avec un modèle de prédiction naïf. Ce modèle supposait que toutes les décisions de trading étaient également probables sans considérer des caractéristiques des données du marché. Le modèle naïf sert de comparaison pour évaluer l'efficacité de divers algorithmes.
On a utilisé les k-plus proches voisins (KNN), les réseaux neuronaux profonds (DNN), les machines à vecteurs de support polynomiales (Poly SVM), les forêts aléatoires et XGBoost pour analyser les données du marché. La performance de ces algorithmes est mesurée par la précision de leurs prédictions d'achats, de ventes et de maintiens.
Évaluation de Performance
Pour évaluer la performance des algorithmes d'apprentissage automatique, on a calculé le nombre de prédictions précises pour les achats, ventes et maintiens. On a aussi mesuré les erreurs de classification pour comprendre où les algorithmes ont échoué.
De plus, on a examiné la performance en termes de profit basée sur les changements réels en pourcentage des prix du marché après les prédictions modélisées. Cela nous a permis de voir les changements accumulés en pourcentage que chaque algorithme a réalisés au fil du temps.
Résultats et Discussion
En analysant la performance des différents algorithmes, on a constaté que certaines méthodes, notamment les forêts aléatoires et KNN, ont surpassé le modèle naïf. Cependant, il a été noté qu'aucun algorithme n'a constamment dépassé la performance d'une approche aléatoire sur tous les marchés.
Les résultats ont montré que l'utilisation des caractéristiques proposées a amélioré la précision de classification dans plusieurs scénarios. De plus, l'application du filtrage GMM a augmenté les chances que les algorithmes donnent de meilleurs résultats. Dans plusieurs cas, l'utilisation des nouvelles caractéristiques a directement conduit à des moyennes plus élevées en termes de mesures de performance.
Pour le marché du Bitcoin, l'utilisation de caractéristiques standardisées a généralement entraîné de meilleurs résultats, alors que le marché Nasdaq n'a pas montré un changement significatif de performance, peu importe les types de caractéristiques. La performance a varié énormément en fonction du marché spécifique et des caractéristiques utilisées.
Les résultats indiquent que l'ingénierie des caractéristiques joue un rôle clé dans le développement de stratégies de trading efficaces. Le clustering des données de marché via GMM s'est avéré être une approche précieuse, permettant une analyse et des décisions de trading améliorées.
Conclusion
Notre enquête met en avant le potentiel de la combinaison de techniques d'apprentissage supervisé et non supervisé pour améliorer la prise de décision en trading sur les marchés financiers. En formulant un ensemble de nouvelles caractéristiques basées sur les pics de prix et en utilisant GMM pour filtrer les données, on peut identifier plus précisément des opportunités de trading rentables.
La performance compétitive de méthodes comme KNN et les forêts aléatoires souligne l'efficacité des caractéristiques que nous avons développées. La capacité de classifier les mouvements du marché avec plus de précision peut vraiment aider les traders à prendre des décisions éclairées sur les marchés émergents et établis.
Les travaux futurs peuvent s'appuyer sur ces résultats, en affinant encore l'ingénierie des caractéristiques et en analysant les méthodes d'apprentissage automatique pour s'adapter à l'évolution des marchés financiers. Les résultats prometteurs de cette étude posent les bases pour davantage d'innovation dans les stratégies de trading et l'analyse de marché utilisant des techniques d'apprentissage avancées.
Titre: Combining supervised and unsupervised learning methods to predict financial market movements
Résumé: The decisions traders make to buy or sell an asset depend on various analyses, with expertise required to identify patterns that can be exploited for profit. In this paper we identify novel features extracted from emergent and well-established financial markets using linear models and Gaussian Mixture Models (GMM) with the aim of finding profitable opportunities. We used approximately six months of data consisting of minute candles from the Bitcoin, Pepecoin, and Nasdaq markets to derive and compare the proposed novel features with commonly used ones. These features were extracted based on the previous 59 minutes for each market and used to identify predictions for the hour ahead. We explored the performance of various machine learning strategies, such as Random Forests (RF) and K-Nearest Neighbours (KNN) to classify market movements. A naive random approach to selecting trading decisions was used as a benchmark, with outcomes assumed to be equally likely. We used a temporal cross-validation approach using test sets of 40%, 30% and 20% of total hours to evaluate the learning algorithms' performances. Our results showed that filtering the time series facilitates algorithms' generalisation. The GMM filtering approach revealed that the KNN and RF algorithms produced higher average returns than the random algorithm.
Auteurs: Gabriel Rodrigues Palma, Mariusz Skoczeń, Phil Maguire
Dernière mise à jour: 2024-08-19 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2409.03762
Source PDF: https://arxiv.org/pdf/2409.03762
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.