Évaluer les données de séries temporelles : Est-ce du bruit blanc ?
Apprends à déterminer si des données de séries temporelles se comportent comme du bruit blanc.
― 6 min lire
Table des matières
Les Données de séries temporelles, c'est partout, des prix des actions aux températures quotidiennes. Parfois, les gens veulent vérifier si ces données se comportent comme du Bruit blanc. Le bruit blanc, c'est un terme chic pour des données aléatoires où chaque valeur ne dépend pas des autres. Imagine écouter une radio sans station-juste du statique. Ça, c’est du bruit blanc !
Dans cet article, on va discuter de comment repérer quand une série temporelle s'éloigne de ce comportement de bruit blanc, surtout quand les données ont des tendances ou changent au fil du temps. On ne suppose pas juste que les données sont parfaites ; on considère que tout peut être un peu bancal.
Le Défi
Il existe plein de méthodes pour vérifier si notre série de données agit comme du bruit blanc. Le souci, c'est que certaines de ces méthodes ne fonctionnent bien que quand les données sont stables et ne changent pas beaucoup. Mais les données réelles peuvent se comporter de manière assez différente !
Imaginons que tu étudies les retours du marché boursier. Un jour, ça peut être fou et volatile, le lendemain ça peut être calme. Donc, on a besoin d'un moyen de voir si c'est vraiment du bruit blanc, même quand ça a l'air un peu chaotique.
L'Idée
Notre plan, c'est de prêter attention à combien les données se rapprochent du comportement de bruit blanc. Au lieu de dire juste "C'est noir ou blanc (bon ou pas)", on veut voir à quel point ça s'écarte du chemin idéal du bruit blanc. On va chercher des mesures “locales” qui montrent combien les données varient à différents moments.
L'idée, c'est que si nos vérifications locales montrent de petites variations autour de zéro, alors on peut quand même dire que c'est assez proche du bruit blanc. Tu peux penser à ça comme vérifier si une pizza a un tout petit peu de fromage brûlé. Si c’est juste un smidge, tu pourrais encore la manger !
Méthodes
Pour tester notre idée, on devra créer un moyen de comparer les données qu'on a avec ce qu'on attend si c'était du bruit blanc. On va vérifier combien l'Autocovariance-la mesure de la relation entre les points de données-s'écarte de zéro.
D'abord, on va faire un instantané de nos données. Pense à ça comme mettre en place une scène pour une pièce : tu veux savoir ce que les acteurs (les points de données) font.
Ensuite, on va utiliser une technique appelée Bootstrapping. C’est comme prendre un tas d’échantillons de nos données, les secouer, et vérifier s'ils ressemblent toujours à du bruit blanc. Si nos échantillons sont encore proches de ce son de radio statique, on peut dire que nos données originales le sont probablement aussi.
Exemples du Monde Réel
Regardons quelques données réelles pour voir si notre idée tient la route. Imagine les prix quotidiens d'une action populaire comme le S&P 500.
Imagine que tu regardes les données de 1980 à 1999. Tu vois des prix monter et descendre. Si tu vérifies la fonction d'autocorrélation (une mesure de comment les points de données sont liés), tu verrais qu'ils n'ont pas vraiment de relations solides au fil du temps.
Mais des tests standards pourraient dire : “Non, ça ce n'est définitivement pas du bruit blanc !” Les résultats peuvent donner l'impression de rejeter l'idée de bruit blanc tout de suite. Cependant, notre méthode pourrait dire : “Attends ! Ces écarts sont si petits qu'on est toujours assez proche du bruit blanc.”
Le Principal Retenue
En permettant de petites Déviations, on espère avoir une meilleure idée de ce qui se passe vraiment dans nos données. Au lieu de dire que c'est blanc ou pas, on peut dire, “Eh bien, c'est surtout du bruit blanc, juste avec quelques bizarreries ici et là !”
C'est particulièrement utile en finance quand on applique notre méthode pour analyser à quel point le marché est vraiment efficace.
Les Aspects Techniques
Maintenant, plongeons dans les aspects plus techniques de notre approche. On ne va pas se perdre dans des formules ou du jargon, mais on va esquisser comment on prévoit de mettre en place nos tests.
Hypothèses
On va tester deux grandes idées :
- L'idée classique de bruit blanc (tout est aléatoire).
- L'idée modifiée (un peu d'aléatoire, c'est ok).
Collecte de Données
On commence par rassembler nos données de séries temporelles. Ça peut inclure n'importe quoi, des prix des actions aux relevés de température.
Mesures Statistiques
En utilisant un logiciel statistique, on va calculer des mesures pertinentes comme l'autocovariance pour vérifier les relations dans nos données au fil du temps.
Bootstrapping
Notre méthode impliquera de créer plusieurs échantillons de nos données pour évaluer l'ampleur et la signification de toutes déviations par rapport au comportement attendu.
Les Résultats
Une fois qu'on applique notre méthode, on va obtenir des résultats intéressants. Par exemple, en regardant les rendements log quotidiens du S&P 500, notre test pourrait montrer que les déviations sont assez minimales.
Si les tests traditionnels rejettent instantanément le bruit blanc avec des p-values basses, notre approche pourrait raconter une autre histoire. Elle pourrait suggérer que bien qu'il y ait des déviations notables, elles ne sont pas assez pour rejeter complètement l'hypothèse de bruit blanc.
Applications Pratiques
Qu'est-ce que ça veut dire pour analyser les données en pratique ? Eh bien, ça donne aux chercheurs et aux analystes plus de flexibilité. Au lieu d'être trop stricts avec leurs conclusions, ils peuvent apprécier la complexité de leurs données.
C'est particulièrement fondamental en finance, où de légères variations pourraient mener à des stratégies et des résultats très différents.
Conclusion
En résumé, vérifier si les données des séries temporelles se comportent comme du bruit blanc, ce n'est pas juste des réponses oui ou non. En examinant les déviations pertinentes, on peut permettre des comportements réalistes dans nos ensembles de données.
On peut embrasser le chaos des données du monde réel tout en gardant les idéaux du bruit blanc.
Et rappelle-toi, tout comme la vie, les données peuvent être en désordre !
Titre: Detecting relevant deviations from the white noise assumption for non-stationary time series
Résumé: We consider the problem of detecting deviations from a white noise assumption in time series. Our approach differs from the numerous methods proposed for this purpose with respect to two aspects. First, we allow for non-stationary time series. Second, we address the problem that a white noise test, for example checking the residuals of a model fit, is usually not performed because one believes in this hypothesis, but thinks that the white noise hypothesis may be approximately true, because a postulated models describes the unknown relation well. This reflects a meanwhile classical paradigm of Box(1976) that "all models are wrong but some are useful". We address this point of view by investigating if the maximum deviation of the local autocovariance functions from 0 exceeds a given threshold $\Delta$ that can either be specified by the user or chosen in a data dependent way. The formulation of the problem in this form raises several mathematical challenges, which do not appear when one is testing the classical white noise hypothesis. We use high dimensional Gaussian approximations for dependent data to furnish a bootstrap test, prove its validity and showcase its performance on both synthetic and real data, in particular we inspect log returns of stock prices and show that our approach reflects some observations of Fama(1970) regarding the efficient market hypothesis.
Auteurs: Patrick Bastian
Dernière mise à jour: 2024-11-11 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2411.06909
Source PDF: https://arxiv.org/pdf/2411.06909
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.