Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico# Intelligenza artificiale

Tecniche di previsione gerarchica avanzate

Un nuovo metodo migliora l'accuratezza delle previsioni a diversi livelli gerarchici.

― 7 leggere min


Nuovo modello per leNuovo modello per leprevisioni gerarchichegerarchie dei dati.delle previsioni attraverso leUn nuovo metodo aumenta l'accuratezza
Indice

Le previsioni accurate sono fondamentali in molti settori, come la gestione dell'energia, la pianificazione delle forniture e l'allocazione delle risorse. Un aspetto chiave delle previsioni è la necessità di garantire che le previsioni siano in linea con la struttura gerarchica dei dati. Ad esempio, se guardiamo al consumo di energia, potremmo avere dati strutturati da singoli edifici a città e poi a stati. Fare previsioni a diversi livelli in una tale struttura può essere difficile, specialmente quando le previsioni a livelli inferiori devono corrispondere a quelle a livelli superiori.

Questo articolo discute un nuovo approccio alle previsioni che combina le previsioni a diversi livelli mantenendole coerenti. Il metodo utilizza un tipo specifico di modello e consente previsioni che possono adattarsi in base alle informazioni variabili. Utilizzando efficacemente una rete neurale, il nostro obiettivo è migliorare l'accuratezza delle previsioni attraverso diversi livelli gerarchici.

La Necessità di Previsioni Coerenti

Quando si fa previsione, soprattutto per sistemi complessi, è comune affrontare gerarchie. Queste gerarchie possono andare dalle divisioni geografiche, come città e stati, alle divisioni temporali, come dati giornalieri e mensili. Le previsioni devono essere coerenti, il che significa che la somma delle previsioni a livelli inferiori dovrebbe essere uguale alle previsioni a livelli superiori.

Ad esempio, se stiamo prevedendo il consumo di energia, l'energia totale prevista per una città deve essere uguale alla somma del consumo previsto per gli edifici all'interno di quella città. Se queste previsioni non corrispondono, possono portare a inefficienze e a decisioni sbagliate.

Le Previsioni Probabilistiche offrono un modo per affrontare l'incertezza nelle previsioni. Invece di fornire una singola previsione, possiamo offrire un intervallo di possibili risultati, come le probabilità che si verifichino determinati livelli di utilizzo energetico. Questo aggiunge un livello di dettaglio che può aiutare nella pianificazione e nell'allocazione delle risorse.

Struttura Gerarchica nelle Previsioni

In molte applicazioni del mondo reale, i dati esistono naturalmente in gerarchie. Ad esempio, nelle previsioni energetiche, potresti avere dati sul consumo suddivisi per ore, giorni, settimane e mesi. Questa natura gerarchica ci consente di ottenere informazioni a diversi livelli, sia per decisioni operative a breve termine che per pianificazioni a lungo termine.

Le previsioni gerarchiche possono essere suddivise in diversi approcci:

  1. Approccio Dall'Alto Verso il Basso: Questo metodo inizia con previsioni a livello più alto e le suddivide in livelli inferiori. Anche se semplice, potrebbe non catturare sempre le sfumature a livelli inferiori.

  2. Approccio Dal Basso Verso l'Alto: Questa strategia parte dal livello più basso con previsioni e le aggrega a livelli superiori. Questo può catturare meglio i dettagli, ma può trascurare tendenze più ampie.

  3. Approccio Dal Centro: Alcuni metodi combinano approcci dall'alto verso il basso e dal basso verso l'alto, cercando di capitalizzare i punti di forza di entrambi.

La sfida rimane che semplicemente aggregare o disaggregare previsioni senza considerare le relazioni tra di esse può portare a imprecisioni. Qui entra in gioco un approccio coerente.

Introduzione di un Nuovo Modello di Previsione

In risposta a queste sfide, è stato sviluppato un nuovo modello che utilizza una struttura di modello fattoriale. Questo significa che, anziché trattare ogni serie in modo indipendente, il modello riconosce che le serie a livello base condividono caratteristiche comuni o "fattori". Facendo ciò, il modello garantisce che le previsioni siano coerenti per design.

Come Funziona il Modello

Il modello funziona riconoscendo che quando permutiamo o riordiniamo le serie a livello base nella gerarchia, le loro somme totali rimangono inalterate. Questa proprietà è nota come scambiabilità. Utilizzando questa proprietà, possiamo sviluppare previsioni che sono intrinsecamente coerenti attraverso diversi livelli di aggregazione.

Per raggiungere questo obiettivo, il modello impiega una rete neurale convoluzionale. Questo tipo di rete neurale è particolarmente efficace per elaborare strutture di dati complesse e può apprendere schemi all'interno dei dati. I parametri prodotti da questa rete possono poi essere utilizzati per generare campioni di previsioni, che possono essere differenziati rispetto ai parametri del modello.

Uno dei vantaggi significativi di questo modello è che può ottimizzare direttamente per diverse funzioni di perdita. Questa flessibilità significa che possiamo scegliere metriche che sono più rilevanti nel contesto delle previsioni, sia concentrandoci su punteggi di probabilità, quantili o altre misure di accuratezza.

Aggregazione Coerente

Un requisito per il nostro modello è che deve garantire un'aggregazione coerente. Questo significa che le previsioni generate per diversi livelli della gerarchia devono corrispondere. Ad esempio, prevedere il consumo totale di energia per una città dovrebbe essere uguale al consumo previsto per ciascun edificio all'interno di quella città.

Per illustrare come funziona, consideriamo uno scenario in cui prevediamo l'uso di energia in diversi momenti. Se prevediamo che un edificio utilizzi 10 unità di energia e un altro edificio utilizzi 20 unità, la nostra previsione a livello di città deve prevedere un totale di 30 unità. Se le nostre previsioni non corrispondono, potrebbe causare problemi significativi nella gestione delle risorse.

Il nostro metodo proposto non solo soddisfa questo requisito, ma lo fa anche in modo che sia adattabile alle caratteristiche specifiche dei dati modellati. Permettendo distribuzioni continue diverse per le previsioni a livello base, il modello può adattarsi meglio alla natura specifica dei dati analizzati.

Valutazione Empirica del Modello

Il modello proposto è stato testato su tre set di dati distinti: dati sul turismo dall'Australia, vendite di generi alimentari dall'Ecuador e dati sul traffico dalla California. Ogni set di dati presenta sfide e gerarchie uniche, rendendoli adatti a testare la flessibilità e l'accuratezza del nuovo metodo di previsione.

Descrizioni dei Set di Dati

  1. Dati sul Turismo: Questo set di dati tiene traccia del numero di visitatori in Australia attraverso varie regioni e motivi di viaggio nel corso di un lungo periodo. La struttura gerarchica rappresenta dati da livelli regionali a livelli nazionali.

  2. Dati sulle Vendite di Generi Alimentari: Questo set di dati contiene dati sulle vendite di numerosi articoli venduti in Ecuador. La gerarchia include livelli da negozi specifici a livelli regionali e nazionali più ampi.

  3. Dati sul Traffico: Questo set di dati fornisce informazioni sui tassi giornalieri di occupazione delle corsie per auto in California. La gerarchia cattura vari livelli di aggregazione, da singole corsie a gruppi più grandi.

Risultati della Valutazione

Le prestazioni del modello sono state confrontate con metodi consolidati nel settore. La valutazione si è concentrata sul Continuous Ranked Probability Score (CRPS) come principale metro di successo. Punteggi più bassi indicano una migliore accuratezza nelle previsioni.

Attraverso i tre set di dati, il nuovo modello ha superato i metodi precedenti, mostrando miglioramenti significativi in accuratezza. In particolare, il modello ha raggiunto risultati quasi ideali ai livelli base della gerarchia, specialmente per i set di dati sul turismo e sulle vendite di generi alimentari.

Ad esempio, nel set di dati sul turismo, il modello proposto ha migliorato l'accuratezza di un margine considerevole rispetto a tecniche precedenti. Tendenze simili sono state osservate nei dati sulle vendite di generi alimentari, mettendo in mostra la capacità del modello di adattarsi efficacemente a diverse strutture di dati.

Analisi di Sensibilità

Per comprendere meglio le prestazioni del modello, sono state condotte analisi di sensibilità. Questo ha incluso l'esame di come la scelta delle distribuzioni a livello base e il numero di fattori utilizzati nel modello influenzassero l'accuratezza complessiva.

Le analisi hanno rivelato che alcune distribuzioni producevano costantemente risultati migliori attraverso i set di dati. Ad esempio, l'uso di una distribuzione normale troncata ha fornito maggiore accuratezza in molti casi, specialmente per set di dati con punti dati scarsi.

In termini di fattori, è stato notato che l'uso di più fattori portava generalmente a migliori prestazioni. Tuttavia, anche un singolo fattore ha mostrato miglioramenti significativi nell'accuratezza, evidenziando l'efficienza e la flessibilità del modello.

Conclusione

Fare previsioni accurate in Strutture gerarchiche presenta una serie unica di sfide. Il modello proposto affronta queste sfide sfruttando le proprietà di scambiabilità e strutture fattoriali per garantire previsioni coerenti e accurate.

Attraverso test empirici rigorosi su set di dati diversificati, questo metodo ha dimostrato miglioramenti notevoli nelle prestazioni di previsione rispetto agli approcci tradizionali. Man mano che le industrie continuano a fare affidamento su decisioni basate sui dati, la capacità di fornire previsioni probabilistiche coerenti si rivelerà preziosa.

La flessibilità del modello proposto consente di adattarsi a varie caratteristiche dei dati, rendendolo uno strumento potente per i professionisti in settori che vanno dalla gestione dell'energia al retail e oltre. Le future ricerche si concentreranno sul miglioramento ulteriore delle capacità del modello per gestire anche set di dati più grandi e relazioni gerarchiche più complesse.

Fonte originale

Titolo: $\clubsuit$ CLOVER $\clubsuit$: Probabilistic Forecasting with Coherent Learning Objective Reparameterization

Estratto: Obtaining accurate probabilistic forecasts is an operational challenge in many applications, such as energy management, climate forecasting, supply chain planning, and resource allocation. Many of these applications present a natural hierarchical structure over the forecasted quantities; and forecasting systems that adhere to this hierarchical structure are said to be coherent. Furthermore, operational planning benefits from the accuracy at all levels of the aggregation hierarchy. However, building accurate and coherent forecasting systems is challenging: classic multivariate time series tools and neural network methods are still being adapted for this purpose. In this paper, we augment an MQForecaster neural network architecture with a modified multivariate Gaussian factor model that achieves coherence by construction. The factor model samples can be differentiated with respect to the model parameters, allowing optimization on arbitrary differentiable learning objectives that align with the forecasting system's goals, including quantile loss and the scaled Continuous Ranked Probability Score (CRPS). We call our method the Coherent Learning Objective Reparametrization Neural Network (CLOVER). In comparison to state-of-the-art coherent forecasting methods, CLOVER achieves significant improvements in scaled CRPS forecast accuracy, with average gains of 15%, as measured on six publicly-available datasets.

Autori: Kin G. Olivares, Geoffrey Négiar, Ruijun Ma, O. Nangba Meetei, Mengfei Cao, Michael W. Mahoney

Ultimo aggiornamento: 2024-12-21 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2307.09797

Fonte PDF: https://arxiv.org/pdf/2307.09797

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili