Simple Science

La science de pointe expliquée simplement

# Statistiques# Méthodologie# Applications# Calculs

Une nouvelle méthode pour normaliser les données de séries temporelles

Ajuster les données de séries chronologiques pour une meilleure analyse et des prévisions.

― 6 min lire


NormalisationNormalisationconditionnelle des sériestemporellesdonnées de séries chronologiques.Approche innovante pour ajuster les
Table des matières

Normalisation Conditionnelle dans l'Analyse des Séries Temporelles

Introduction

Les Données de séries temporelles, qui enregistrent des mesures au fil du temps, peuvent souvent montrer des variations dues à d'autres facteurs liés. C'est important de prendre en compte ces facteurs quand on analyse les données. On vous présente une nouvelle méthode pour normaliser les données de séries temporelles. Cette approche se concentre sur l'ajustement des données en fonction de certaines variables influentes. En faisant ça, on peut mieux comprendre les principaux schémas dans les données et faire des prévisions plus précises.

Aperçu de la Normalisation

La normalisation, c'est le processus d'ajustement des valeurs à une échelle commune. Dans notre cas, on veut enlever les variations causées par des facteurs externes. Les méthodes traditionnelles de normalisation, comme ajuster en fonction des valeurs maximales ou des Moyennes, ne sont pas toujours adaptées aux données de séries temporelles. C'est parce que les conditions peuvent changer avec le temps, et la normalisation standard suppose que les données restent stables.

Beaucoup de méthodes existantes divisent les données en segments ou fenêtres et normalisent à l'intérieur de ces segments. Cependant, ces méthodes ne prennent pas souvent en compte d'autres variables qui peuvent avoir un effet sur les données.

Notre méthode proposée normalise les données de séries temporelles tout en tenant compte de ces variables externes. Ça implique d'estimer la valeur moyenne et l'étendue (ou Variance) des données en fonction de ces facteurs externes. Ce processus nous permet d'avoir une vision plus claire des données de séries temporelles.

Méthode de Normalisation Conditionnelle

On commence par modéliser la moyenne (moyenne) et la variance de la série temporelle en utilisant des variables externes. On utilise un type de modélisation flexible appelé modèles additifs généralisés (GAMs). La moyenne et la variance sont ensuite utilisées pour ajuster les données de séries temporelles.

En pratique, on commence par estimer la moyenne avec un modèle. On crée ensuite un deuxième modèle qui regarde comment l'étendue des données change. Les résultats de ces modèles nous donnent les valeurs nécessaires pour normaliser les données.

Applications de la Normalisation Conditionnelle

Notre méthode de normalisation a des applications pratiques dans différents domaines. Par exemple, on a appliqué cette approche pour analyser les données de rivières. Cet exemple montre comment normaliser les séries temporelles peut aider à combler les valeurs manquantes et à prédire les tendances futures.

  1. Imputation des Valeurs Manquantes: En manipulant des données de séries temporelles, il est courant de rencontrer des lacunes à cause de perturbations dans la collecte des données. Notre méthode peut prédire ces valeurs manquantes avec précision en tenant compte de la moyenne estimée et de la variance.

  2. Estimation des Relations: La série temporelle ajustée peut aussi être utilisée pour estimer les relations entre différentes variables au fil du temps. Par exemple, on peut analyser comment la qualité de l'eau de la rivière est affectée par les conditions en amont.

Exemple Pratique : Données de Température de la Rivière

On a étudié comment cette méthode de normalisation peut être utilisée avec des données de température de la rivière Boise aux États-Unis. Les données comprenaient des relevés de température quotidiens de différents endroits le long de la rivière. Il y a eu plusieurs lacunes à cause de problèmes de capteurs.

Pour combler ces lacunes, notre méthode a été appliquée pour estimer les températures moyennes en tenant compte de facteurs comme la température de l'air. Les résultats ont montré que notre modèle pouvait prédire efficacement les valeurs manquantes.

Comprendre les Résultats

On a constaté que quand on ajustait les variables externes, les prévisions pour les valeurs de température manquantes étaient très précises. Le modèle a aussi capturé les changements saisonniers de température, montrant comment les températures de l'eau se comportent à différentes périodes de l'année.

Utilisation de la Normalisation pour les Estimations de Temps

Une autre application importante est d'estimer combien de temps il faut pour que l'eau s'écoule en aval entre les capteurs. On visait à déterminer le temps de retard en utilisant nos données normalisées. Ce temps de retard peut changer en fonction de diverses conditions en amont, comme les pluies ou les niveaux d'eau.

En analysant les relations fournies par la série temporelle normalisée, on a pu estimer avec précision le temps de retard entre deux capteurs. Cette information est cruciale pour comprendre la qualité de l'eau et prendre des décisions de gestion informées.

Conclusion

La normalisation des données de séries temporelles avec notre nouvelle méthode présente des avantages significatifs pour l'analyse des données. En ajustant pour les variables influentes, on peut interpréter les schémas avec précision, combler les valeurs manquantes et estimer les relations entre différents facteurs.

Cette approche peut améliorer l'analyse de divers ensembles de données de séries temporelles dans différents domaines, en particulier dans la surveillance environnementale et les domaines connexes.

Directions Futurs

Il y a un potentiel pour des recherches supplémentaires pour développer ce travail. On peut explorer l'analyse de données avec des relations plus complexes ou utiliser des méthodes qui prennent en compte comment les points de données s'influencent mutuellement. De plus, l'approche pourrait être élargie pour considérer plusieurs séries temporelles interconnectées simultanément.

En résumé, le contrôle des variations dans les données de séries temporelles est essentiel pour une analyse efficace. Notre méthode fournit une base solide pour une meilleure prise de décisions basée sur les données et la compréhension des tendances.

Source originale

Titre: Conditional normalization in time series analysis

Résumé: Time series often reflect variation associated with other related variables. Controlling for the effect of these variables is useful when modeling or analysing the time series. We introduce a novel approach to normalize time series data conditional on a set of covariates. We do this by modeling the conditional mean and the conditional variance of the time series with generalized additive models using a set of covariates. The conditional mean and variance are then used to normalize the time series. We illustrate the use of conditionally normalized series using two applications involving river network data. First, we show how these normalized time series can be used to impute missing values in the data. Second, we show how the normalized series can be used to estimate the conditional autocorrelation function and conditional cross-correlation functions via additive models. Finally we use the conditional cross-correlations to estimate the time it takes water to flow between two locations in a river network.

Auteurs: Puwasala Gamakumara, Edgar Santos-Fernandez, Priyanga Dilini Talagala, Rob J. Hyndman, Kerrie Mengersen, Catherine Leigh

Dernière mise à jour: 2023-05-21 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2305.12651

Source PDF: https://arxiv.org/pdf/2305.12651

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires