Avancées dans la prédiction des prix des actions avec des modèles LSTM
Cette étude évalue l'efficacité du LSTM multivarié bidirectionnel dans la prédiction des actions.
Omkar Oak, Rukmini Nazre, Rujuta Budke, Yogita Mahatekar
― 6 min lire
Table des matières
Prédire les prix des actions est super important pour les investisseurs qui veulent prendre des décisions intelligentes dans un marché très imprévisible. C'est encore plus vrai sur le marché boursier indien, où les prix changent rapidement. Avec les bonnes prévisions, les investisseurs peuvent mieux gérer les risques et profiter des changements du marché. On a essayé plein de méthodes différentes pour prédire les prix, des techniques simples comme la régression aux approches plus avancées comme les Réseaux de Neurones Artificiels (ANN). Mais des études montrent que les réseaux de Mémoire à Long et Court Terme (LSTM) sont souvent le meilleur choix pour prévoir les prix des actions. Les LSTM sont un type de modèle d'apprentissage profond qui peut comprendre des motifs complexes dans des données temporelles, ce qui les rend particulièrement utiles pour l'analyse financière.
But de l'étude
Cette étude se concentre sur un modèle spécifique appelé LSTM Multivarié Bidirectionnel. Il est conçu pour prédire les prix des actions à court terme pour les entreprises cotées dans l'indice NIFTY 100, qui comprend des acteurs majeurs du marché indien. L'objectif principal est d'analyser à quel point ce modèle peut prévoir les prix en fonction des performances passées, et il examine de près les actions de quatre secteurs clés : la banque, l'énergie, la construction et la technologie.
Collecte de données
Pour mener l'analyse, les chercheurs ont rassemblé huit ans de données de trading horaires de 2015 à 2022. Ces données ont été collectées à partir de diverses sources et comprenaient des informations sur les prix des actions à différents moments. Au total, ils ont rassemblé une quantité substantielle de données, s'assurant d'avoir assez d'échantillons pour une analyse efficace.
Méthodologie
L'étude a utilisé des modèles LSTM Univariés et Multivariés. Le modèle Univarié se concentre uniquement sur le prix d'une seule action, tandis que le modèle Multivarié inclut plusieurs caractéristiques, comme les prix des actions et les volumes de trading. Les chercheurs ont également examiné comment l'ajout d'Indicateurs techniques - des statistiques qui aident à montrer les tendances du marché - pourrait améliorer les prévisions. Ces indicateurs comprenaient des métriques comme les moyennes mobiles et les prix à des intervalles de temps spécifiques.
Indicateurs Techniques
Choisir les bons indicateurs techniques était crucial. Les chercheurs ont identifié 12 indicateurs qui étaient étroitement corrélés avec les prix des actions. Ces indicateurs aident à révéler le comportement du marché et fournissent des informations précieuses pour le modèle. Les indicateurs ont été utilisés avec les données historiques des prix pour donner au modèle une meilleure chance de faire des prévisions précises.
Quelques indicateurs clés comprenaient :
- Moyenne Mobile Simple (SMA) : Ça mesure le prix moyen de l'action sur un nombre de jours déterminé.
- Moyenne Mobile Exponentielle (EMA) : Ça donne plus de poids aux prix récents, ce qui la rend plus réactive aux changements.
- Bandes de Bollinger : Elles montrent la volatilité du prix et aident à identifier si une action est surachetée ou sous-vendue.
Traitement des données
Avant d'utiliser les données dans le modèle prédictif, les chercheurs ont dû les prétraiter. Cela a impliqué de nettoyer l'ensemble de données et de s'assurer qu'il était formaté correctement. Ils ont normalisé les données pour que toutes les valeurs tombent dans une plage spécifique, ce qui aide le modèle à mieux fonctionner. Les chercheurs ont ensuite divisé les données en ensembles d'entraînement, de test et de validation, ce qui leur a permis de mesurer la performance du modèle avec précision.
Entraînement du modèle
Le modèle LSTM Multivarié Bidirectionnel a été entraîné en utilisant les données nettoyées. Le modèle traite les informations dans les deux sens, ce qui lui permet de capturer des tendances et des dépendances pertinentes. En utilisant une approche de fenêtre glissante, le modèle crée des séquences de données qui se chevauchent pour l'entraînement. Cela signifie qu'il peut utiliser les prix passés pour prédire les prix futurs plus efficacement.
Évaluation
Pour évaluer la performance des modèles, plusieurs mesures standard ont été utilisées. Celles-ci comprenaient :
- Score R² : Ça mesure à quel point le modèle explique la variance des données.
- Erreur Absolue Moyenne (MAE) : Ça mesure la différence moyenne entre les valeurs réelles et prédites.
- Erreur Quadratique Moyenne (RMSE) : Ça vérifie à quelle distance les prévisions s'écartent des valeurs réelles.
Résultats
Les résultats étaient prometteurs. Le modèle LSTM Bidirectionnel, en particulier lorsqu'il utilise des indicateurs techniques, a dépassé les modèles LSTM Univariés plus simples. Il a atteint un score R² élevé sur toutes les actions analysées, indiquant une grande précision dans ses prévisions. L'incorporation d'indicateurs techniques a aidé le modèle à apprendre des motifs plus complexes, souvent manqués dans des modèles plus simples.
Par exemple, en analysant des actions comme ICICI Bank, NTPC, Ambuja Cement et Wipro, le modèle LSTM Bidirectionnel a montré qu'il pouvait prédire les prix avec une précision remarquable. Les études ont trouvé que ce modèle non seulement capturait les tendances de prix immédiates mais tenait aussi compte des mouvements à plus long terme sur le marché.
Conclusion
En résumé, la recherche souligne le potentiel d'utiliser des modèles d'apprentissage machine avancés comme le LSTM Multivarié Bidirectionnel pour la prédiction des prix des actions. En intégrant divers indicateurs techniques et en se concentrant sur des stratégies de trading à court terme, les investisseurs pourraient bénéficier d'une meilleure précision des prévisions.
Cette étude ouvre la porte à des recherches supplémentaires qui pourraient étendre l'application du modèle au-delà du marché boursier indien. Les travaux futurs pourraient inclure différents ensembles de données d'autres pays pour voir si ces modèles conservent leur force prédictive à travers divers marchés. De plus, inclure plus de variables, comme des indicateurs économiques et le sentiment du marché, pourrait créer une compréhension encore plus large de la dynamique des prix des actions.
Dans l'ensemble, cette approche fournit un chemin plus clair pour prendre des décisions éclairées dans le trading d'actions, ce qui pourrait mener à des investissements plus réussis dans le monde rapide de la finance.
Titre: A Novel Multivariate Bi-LSTM model for Short-Term Equity Price Forecasting
Résumé: Prediction models are crucial in the stock market as they aid in forecasting future prices and trends, enabling investors to make informed decisions and manage risks more effectively. In the Indian stock market, where volatility is often high, accurate predictions can provide a significant edge in capitalizing on market movements. While various models like regression and Artificial Neural Networks (ANNs) have been explored for this purpose, studies have shown that Long Short-Term Memory networks (LSTMs) are the most effective. This is because they can capture complex temporal dependencies present in financial data. This paper presents a Bidirectional Multivariate LSTM model designed to predict short-term stock prices of Indian companies in the NIFTY 100 across four major sectors. Both Univariate LSTM and Univariate Bidirectional LSTM models were evaluated based on R2 score, RMSE, MSE, MAE, and MAPE. To improve predictive accuracy, the analysis was extended to multivariate data. Additionally, 12 technical indicators, having high correlation values with the close price(greater than 0.99) including EMA5, SMA5, TRIMA5, KAMA10 and the Bollinger Bands were selected as variables to further optimize the prediction models. The proposed Bidirectional Multivariate LSTM model, when applied to a dataset containing these indicators, achieved an exceptionally high average R2 score of 99.4779% across the four stocks, which is 3.9833% higher than that of the Unidirectional Multivariate LSTM without technical indicators. The proposed model has an average RMSE of 0.0103955, an average MAE of 0.007485 and an average MAPE of 1.1635%. This highlights the model's exceptional forecasting accuracy and emphasizes its potential to improve short-term trading strategies.
Auteurs: Omkar Oak, Rukmini Nazre, Rujuta Budke, Yogita Mahatekar
Dernière mise à jour: 2024-09-22 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2409.14693
Source PDF: https://arxiv.org/pdf/2409.14693
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.