Faire avancer les prévisions avec des méthodes basées sur les caractéristiques
Cet article parle de méthodes innovantes pour améliorer la précision des prévisions en utilisant des caractéristiques.
― 9 min lire
Table des matières
- Pourquoi les modèles uniques ne fonctionnent pas toujours
- Qu'est-ce que le méta-apprentissage ?
- Questions clés dans la prévision basée sur les caractéristiques
- Génération de données de séries temporelles
- Extraction de caractéristiques des séries temporelles
- Techniques de combinaison de prévisions
- Élagage des prévisions pour la combinaison
- Problèmes pratiques en prévision
- Conclusion
- Source originale
- Liens de référence
Prévoir, c’est un truc super important dans plein de domaines, surtout en économie. Le monde dans lequel on vit regorge de problèmes complexes qu’on peut pas résoudre qu’avec un seul modèle de prévision. Différentes méthodes montrent des niveaux de succès variés, selon la série temporelle qu’on analyse. Quand on doit gérer beaucoup de séries temporelles, c’est courant de suivre deux stratégies principales : choisir des modèles selon certaines caractéristiques ou combiner plusieurs modèles ensemble. Cet article explore ces méthodes avancées de prévision, en mettant l’accent sur comment utiliser les caractéristiques pour améliorer l'exactitude et l’efficacité.
Pourquoi les modèles uniques ne fonctionnent pas toujours
Le principe de la prévision, c’est d’anticiper des valeurs futures en se basant sur des données passées. Mais aucun modèle à lui tout seul marche parfaitement dans chaque situation. C’est résumé par le théorème du No-Free-Lunch, qui dit qu’aucun modèle ne va toujours surpasser les autres dans toutes les circonstances. Donc, quand on essaie de prévoir plein de séries temporelles différentes, c’est mieux d'utiliser les caractéristiques des données pour choisir le modèle le plus adapté ou trouver la meilleure combinaison de modèles pour chaque série.
Qu'est-ce que le méta-apprentissage ?
Le méta-apprentissage est une méthode utilisée en apprentissage automatique qui aide à automatiser le processus de choix de la meilleure méthode de prévision. Ça permet au modèle d’apprendre des données passées, le rendant plus efficace pour sélectionner ou combiner des modèles de prévision à l’avenir. Ce processus se divise en deux grandes parties : l’entraînement du modèle et la réalisation de prévisions.
Phase d’entraînement du modèle
Dans cette phase, les données de référence sont divisées en ensembles pour l’entraînement et le test. Un méta-apprenant observe les prévisions individuelles générées par différents modèles et leur performance selon un critère d'erreur. L’objectif est de minimiser les erreurs de prévision en apprenant quels modèles fonctionnent le mieux dans certaines conditions. Une fois formé, le méta-apprenant peut choisir la meilleure méthode ou une combinaison de méthodes pour toute nouvelle série temporelle basée sur ses caractéristiques.
Faire des prévisions
Après l’entraînement du modèle, l’étape suivante est la prévision. Pour toute nouvelle série temporelle, le modèle entraîné peut calculer des caractéristiques et appliquer la méthode de prévision ou les poids de combinaison les plus adaptés.
Questions clés dans la prévision basée sur les caractéristiques
Quand on applique la prévision basée sur les caractéristiques, les prévisionnistes doivent répondre à quelques questions importantes :
- Quelles données d’entraînement doivent être utilisées pour former le méta-apprenant ?
- Quelles caractéristiques décrivent le mieux les caractéristiques de la série temporelle ?
- Quelles prévisions doivent être incluses dans le pool de prévisions ?
- Comment appliquer les méta-apprenants dans des situations réelles ?
Répondre à ces questions est crucial pour une prévision efficace basée sur les caractéristiques, et on en discutera plus tard.
Génération de données de séries temporelles
L’efficacité des méthodes de prévision dépend énormément de la diversité des données d’entraînement. Dans beaucoup d’industries aujourd’hui, on a accès à d'énormes quantités de données qu’on peut utiliser pour former des modèles de prévision. Cependant, dans certains cas, les données historiques peuvent manquer ou être difficiles à obtenir. Pour résoudre ces problèmes, on introduit des méthodes pour générer des données de séries temporelles synthétiques.
Génération de séries temporelles diverses
Des recherches ont montré que l’utilisation de données générées peut améliorer l’apprentissage des algorithmes dans diverses situations. Plusieurs méthodes peuvent créer des séries temporelles synthétiques, y compris des modèles autorégressifs à mélange gaussien. Ces modèles peuvent gérer différents motifs, tendances et autres caractéristiques qui peuvent exister dans les données de séries temporelles réelles.
En utilisant une méthode appelée GeneRAting TIme Series (GRATIS), il est possible de générer des séries temporelles diverses avec les caractéristiques souhaitées. Cette méthode utilise plusieurs composants autorégressifs qui aident à capturer diverses caractéristiques des données.
Séries temporelles multi-saisonnières
Il est courant que les séries temporelles montrent plusieurs motifs saisonniers. Par exemple, une série temporelle quotidienne pourrait avoir des tendances quotidiennes, hebdomadaires et mensuelles. Simuler de telles données multi-saisonnières implique de combiner diverses séries temporelles simulées avec leurs fréquences correspondantes.
Extraction de caractéristiques des séries temporelles
Les caractéristiques sont essentielles pour décrire les données de séries temporelles et peuvent inclure des statistiques simples comme les moyennes et les variances. Cependant, il n’y a pas un seul ensemble de « meilleures » caractéristiques pour toutes les situations. Le choix des caractéristiques dépend à la fois des caractéristiques des données analysées et des objectifs de l’analyse.
Extraction automatique de caractéristiques
Récemment, des approches automatisées pour l’extraction de caractéristiques ont gagné en popularité. Cela permet d'extraire des caractéristiques sans nécessiter de connaissances d’expert ou d’efforts manuels extensifs. L’imagerie de séries temporelles, par exemple, est une de ces méthodes qui transforme les données en représentations visuelles à partir desquelles des caractéristiques peuvent être dérivées.
Caractéristiques courantes dans les séries temporelles
Les caractéristiques courantes incluent des statistiques qui peuvent résumer la série temporelle, comme les autocorrelations et la décomposition saisonnière. Choisir les bonnes caractéristiques peut avoir un impact énorme sur la performance des prévisions. Divers outils et bibliothèques existent désormais pour aider à calculer ces caractéristiques efficacement.
Techniques de combinaison de prévisions
Quand plusieurs prévisions sont disponibles, les combiner peut améliorer l’exactitude. Plutôt que de se fier à une seule prévision, il est possible de faire la moyenne de plusieurs prévisions pour mieux capter les résultats potentiels. Cependant, la sélection minutieuse des prévisions à combiner est importante pour que cette stratégie soit efficace.
Élagage des prévisions pour la combinaison
L’élagage des prévisions aide à identifier les meilleures prévisions à inclure dans une combinaison. Plusieurs facteurs doivent être pris en compte, y compris l'exactitude, la robustesse et la diversité des prévisions individuelles. Un modèle robuste montre une performance cohérente à travers diverses séries, tandis que la diversité garantit que les prévisions fournissent des informations indépendantes.
Critères pour la sélection des prévisions
- Exactitude : Il est important d’exclure les prévisions mal performantes, car elles peuvent nuire à l’exactitude globale.
- Robustesse : Les prévisions qui montrent de la cohérence à travers différents ensembles de données sont préférées.
- Diversité : Inclure des prévisions qui diffèrent les unes des autres peut fournir des informations précieuses qui aident à atteindre une meilleure exactitude.
Nouveaux algorithmes d’élagage
Dernièrement, de nouveaux algorithmes ont été développés qui prennent en compte l’exactitude, la robustesse et la diversité des prévisions en même temps. Ces algorithmes peuvent efficacement sélectionner la meilleure combinaison de prévisions à partir d’un large pool.
Problèmes pratiques en prévision
Plusieurs problèmes du monde réel se posent lors de l’implémentation de méthodes de prévision basées sur les caractéristiques. Un défi commun est la demande intermittente, où la demande se produit de manière sporadique ou pas du tout à certains moments. On voit souvent cela dans des secteurs comme l'électronique et l'automobile, rendant la prévision particulièrement difficile.
Prévision de la demande intermittente
S’attaquer à la demande intermittente peut bénéficier d'un cadre de combinaison basé sur les caractéristiques qui a montré améliorer à la fois les prévisions ponctuelles et quantiles. En comprenant la nature de la demande et en utilisant des caractéristiques appropriées, on peut générer de meilleures prévisions.
Estimation de l'incertitude
Un autre problème pratique en prévision est l’estimation de l'incertitude. Des compétitions récentes en prévision ont mis l’accent sur le besoin de prévisions probabilistes, qui aident à la prise de décision en fournissant une meilleure compréhension des risques potentiels. Les intervalles de prévision forment un type plus simple de prévisions probabilistes qui peuvent faciliter l’évaluation de l’incertitude.
Conclusion
Alors qu’on navigue dans un monde de plus en plus riche en données, les méthodes basées sur les caractéristiques pour la prévision ont montré un grand potentiel. En utilisant des données de référence diverses et une extraction automatique de caractéristiques, les prévisionnistes peuvent faire des prédictions plus éclairées. Le processus de combinaison des prévisions basé sur leurs caractéristiques peut mener à la fois à une meilleure exactitude et à une meilleure compréhension des incertitudes. Cependant, plus de recherches sont nécessaires sur la prévision probabiliste, ainsi que sur l’interprétation des caractéristiques et des poids.
En résumé, les techniques de prévision basées sur les caractéristiques promettent beaucoup pour améliorer l’exactitude des prévisions, surtout dans des applications complexes et réelles. À mesure que ces méthodes continuent d’évoluer, leur application pourrait avoir des impacts considérables dans divers secteurs.
Titre: Forecasting large collections of time series: feature-based methods
Résumé: In economics and many other forecasting domains, the real world problems are too complex for a single model that assumes a specific data generation process. The forecasting performance of different methods changes depending on the nature of the time series. When forecasting large collections of time series, two lines of approaches have been developed using time series features, namely feature-based model selection and feature-based model combination. This chapter discusses the state-of-the-art feature-based methods, with reference to open-source software implementations.
Auteurs: Li Li, Feng Li, Yanfei Kang
Dernière mise à jour: 2023-09-24 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2309.13807
Source PDF: https://arxiv.org/pdf/2309.13807
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.