Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico

Progressi nella Previsione del Carico a Breve Termine

Nuovo dataset migliora i metodi di previsione energetica per gli edifici.

― 10 leggere min


Aumentare l'accuratezzaAumentare l'accuratezzadelle previsionienergetichecarico energetico a breve termine.Nuovo dataset migliora le previsioni di
Indice

La previsione del carico a breve termine (STLF) è il processo di previsione di quanta energia consumeranno gli edifici nel prossimo futuro, tipicamente da un'ora a qualche giorno avanti. Questo tipo di previsione è importante per i sistemi di gestione dell'energia, aiutando a bilanciare l'offerta energetica con la domanda e a stabilire i prezzi nei mercati energetici. Con la crescita dei contatori intelligenti e dei sensori avanzati, c'è un interesse crescente nell'utilizzare metodi basati sui dati per migliorare l'accuratezza. Tuttavia, molti studi hanno affrontato sfide a causa della mancanza di grandi set di dati disponibili che rappresentino una varietà di tipi e condizioni di edifici.

La Necessità di Grandi Set di Dati

Molti approcci al STLF si basano su machine learning e altre tecniche basate sui dati per fare previsioni. Tuttavia, questi metodi spesso necessitano di molti dati per funzionare bene, specialmente se devono essere addestrati su diversi tipi di edifici. Sfortunatamente, la maggior parte dei set di dati disponibili sono piccoli e potrebbero non coprire abbastanza varietà in termini di posizione geografica, tipo di edificio o modelli di occupazione. Questa mancanza di diversità rende difficile creare modelli efficaci che si generalizzino bene tra edifici diversi.

Per colmare questa lacuna, i ricercatori hanno sviluppato un nuovo set di dati chiamato BuildingsBench. Questo set di dati include dati sui consumi energetici di 900.000 edifici simulati negli Stati Uniti. Include anche una raccolta di dati reali sugli edifici per aiutare a valutare l'efficacia dei modelli di previsione.

Panoramica di BuildingsBench

BuildingsBench è un set di dati su larga scala che mira a migliorare la previsione del carico a breve termine. È composto da due componenti principali:

  1. Buildings-900K: Un set di dati di 900.000 edifici simulati che rappresentano una vasta gamma di tipi di edifici e profili di consumo energetico.
  2. Piattaforma di Valutazione: Una raccolta di oltre 1.900 edifici residenziali e commerciali reali raccolti da sette set di dati aperti.

Il set di dati consente ai ricercatori di confrontare diversi metodi di previsione, incluse tecniche nuove che non sono state testate ampiamente prima. Esamina anche due compiti specifici: STLF zero-shot, dove i modelli prevedono i carichi per edifici sconosciuti senza alcun aggiustamento, e l'Apprendimento per trasferimento, dove i modelli vengono ulteriormente adattati utilizzando dati da edifici specifici.

Importanza di Previsioni Accurate

Gli edifici residenziali e commerciali rappresentano una parte significativa del consumo energetico e delle emissioni di gas serra. Negli Stati Uniti, gli edifici sono responsabili di circa il 40% del consumo energetico e del 35% delle emissioni. A livello globale, questi numeri sono circa il 30% e il 27%, rispettivamente. Ridurre il consumo di energia negli edifici gioca un ruolo cruciale nell'affrontare il cambiamento climatico e nel raggiungere gli obiettivi di sostenibilità.

Una previsione accurata del carico a breve termine può aiutare a ottimizzare la gestione delle risorse energetiche. Può anche assistere nella pianificazione per l'integrazione delle energie rinnovabili, garantendo che l'offerta soddisfi efficacemente la domanda e minimizzando i costi associati alla fornitura di energia.

I Set di Dati in Dettaglio

Buildings-900K

Buildings-900K è tratto da un database noto come National Renewable Energy Laboratory (NREL) End-Use Load Profiles (EULP). Questo set di dati include dati sul consumo energetico simulato a intervalli di 15 minuti, rappresentando migliaia di edifici in vari climi negli Stati Uniti. Gli edifici sono stati modellati attentamente per riflettere non solo i loro modelli di utilizzo energetico, ma anche fattori socio-economici come la posizione e le caratteristiche dell'edificio.

Per rendere il set di dati gestibile, i ricercatori hanno aggregato i dati a una risoluzione oraria, riducendo le dimensioni pur mantenendo dettagli essenziali. L'intero set di dati è di circa 110 GB, consentendo un accesso e un utilizzo più facili nella ricerca.

Il set di dati consente ai ricercatori di studiare molti aspetti diversi del consumo energetico, inclusi come il tipo di edificio, la posizione e l'occupazione cambiano i modelli di utilizzo energetico.

Piattaforma di Valutazione degli Edifici Reali

Oltre ai dati simulati, la piattaforma di valutazione include dati da 1.900 edifici reali. Questi edifici provengono da vari studi e progetti, fornendo ulteriore contesto per capire come si comportano i modelli sui dati del mondo reale. Confrontando le previsioni sui set di dati simulati e reali, i ricercatori possono meglio valutare l'efficacia dei loro modelli di previsione.

I set di dati degli edifici reali sono stati selezionati con cura per fornire una vasta gamma di condizioni, garantendo che integrino bene i dati simulati. Questa diversità aumenta la robustezza dei risultati della ricerca e contribuisce a tecniche di previsione più affidabili.

Come Funzionano i Modelli STLF

Alla base, la previsione del carico a breve termine si basa su dati storici per fare previsioni sul futuro consumo energetico. I modelli STLF analizzano i carichi passati e vari altri fattori, come il giorno della settimana, l'ora del giorno e le condizioni meteorologiche, per prevedere il consumo energetico futuro.

Previsione Zero-Shot

Nella previsione zero-shot STLF, ai modelli viene chiesto di prevedere i carichi energetici per edifici che non hanno mai visto prima. Questo scenario è particolarmente utile per implementare rapidamente i modelli in nuove impostazioni dove i dati per l'affinamento potrebbero essere limitati. Consente un'implementazione efficiente e può ridurre significativamente il tempo necessario per integrare i sistemi di gestione dell'energia negli edifici appena strumentati.

Apprendimento per Trasferimento

L'apprendimento per trasferimento rappresenta un approccio diverso, dove un modello che è stato pre-addestrato su un grande set di dati (come Buildings-900K) viene affinato utilizzando una quantità limitata di dati da un edificio specifico. Questo metodo sfrutta la conoscenza generale acquisita dal modello e la adatta per adattarsi al nuovo contesto specifico. Spesso porta a prestazioni migliori rispetto all'addestramento di un modello da zero, specialmente quando i dati sono limitati.

Valutazione dei Modelli STLF

Per garantire che i modelli stiano funzionando accuratamente, vengono utilizzate varie metriche per valutarne l'efficacia. Due metriche principali sono:

  • Errore Quadratico Medio Normalizzato (NRMSE): Questa metrica valuta quanto i valori previsti siano vicini ai valori di consumo reali. Un NRMSE più basso indica prestazioni migliori.
  • Punteggio di Probabilità Classificata (RPS): Questa metrica viene utilizzata per valutare l'incertezza delle previsioni. Confronta la distribuzione prevista dei carichi energetici con i valori osservati effettivi, aiutando a quantificare quanto bene il modello può tener conto della variabilità nelle previsioni di carico.

Utilizzando queste metriche, i ricercatori possono identificare quali modelli sono più efficaci nel prevedere il consumo energetico e in quali condizioni si comportano meglio.

Risultati da BuildingsBench

I primi risultati dei test su vari modelli sul set di dati BuildingsBench hanno mostrato risultati promettenti. I modelli pre-addestrati, in particolare quelli che utilizzano l'architettura dei trasformatori, hanno dimostrato una forte capacità di adattarsi a edifici reali dopo essere stati pre-addestrati su dati simulati.

Risultati Zero-Shot STLF

Nei test di previsione zero-shot, i modelli hanno mostrato buone prestazioni quando prevedevano carichi per edifici sconosciuti, specialmente commerciali. I modelli addestrati su Buildings-900K sono stati in grado di generalizzare il loro apprendimento e fornire forti previsioni per gli edifici di test, contribuendo a capire che il pre-addestramento sintetico può essere efficace per la previsione degli edifici commerciali.

Tuttavia, le prestazioni degli edifici residenziali erano più variabili, evidenziando le sfide poste dall'imprevedibilità intrinseca dell'uso energetico residenziale. È comune che i carichi residenziali fluttuino significativamente in base al comportamento degli occupanti e ad altri fattori non osservati.

Risultati dell'Apprendimento per Trasferimento

Per quanto riguarda l'apprendimento per trasferimento, l'affinamento dei modelli pre-addestrati su dati limitati da edifici specifici ha portato a notevoli miglioramenti nell'accuratezza. I risultati indicano che consentire a tutti i livelli di un modello di essere affinati era cruciale per migliorare le prestazioni, poiché affinare solo l'ultimo livello spesso portava a una minore accuratezza.

Questi risultati suggeriscono che la capacità di un modello di adattarsi e apprendere dai dati specifici di un edificio è vitale per ottenere migliori risultati di previsione.

Approfondimenti sui Set di Dati

L'analisi dei set di dati ha rivelato schemi interessanti. Set di dati più grandi e diversificati, in genere, portano a migliori prestazioni del modello. Tuttavia, c'era un punto di rendimenti decrescenti, il che significa che semplicemente aumentare le dimensioni dei dati potrebbe non sempre portare a miglioramenti significativi nell'accuratezza.

Al contrario, la scelta delle dimensioni del modello ha anche giocato un ruolo nelle prestazioni. Modelli più piccoli hanno spesso ottenuto risultati migliori su alcuni compiti, in particolare nel contesto degli edifici residenziali. Questo suggerisce che utilizzare un approccio più raffinato nella costruzione dei modelli potrebbe portare a una maggiore accuratezza, soprattutto quando si trattano dati residenziali rumorosi.

Sfide con la Previsione degli Edifici Residenziali

La previsione del consumo energetico residenziale presenta un insieme diverso di sfide rispetto agli edifici commerciali. La variabilità associata al comportamento degli occupanti, alle condizioni meteorologiche locali e a come vengono utilizzati gli edifici rende la previsione del carico residenziale più complessa.

Molti studi hanno scoperto che i modelli faticano a generalizzare bene agli edifici residenziali perché spesso si basano pesantemente sui dati storici di carico. La variabilità nell'uso energetico in base al comportamento degli occupanti significa che spesso c'è meno prevedibilità rispetto agli edifici commerciali, che tendono a avere modelli di utilizzo più stabili.

Di conseguenza, i ricercatori stanno esplorando nuovi approcci, inclusa l'integrazione di ulteriori tipi di dati, come le condizioni meteorologiche e altri covariati pertinenti, per migliorare l'accuratezza del modello per gli edifici residenziali.

Direzioni per la Ricerca Futura

Con l'introduzione di BuildingsBench, il campo della previsione del carico a breve termine ha ora l'opportunità per una ricerca più ricca e diversificata. Diverse potenziali direzioni future della ricerca includono:

  1. Incorporare Dati Meteorologici: Includere modelli meteorologici può fornire un quadro più chiaro di come le condizioni esterne influenzano il consumo energetico degli edifici, migliorando l'accuratezza del modello.
  2. Combinare Dati Sintetici e Reali: Mescolare dati simulati con dati reali potrebbe sfruttare i punti di forza di entrambi per creare modelli di previsione più robusti.
  3. Benchmarking Tecniche Avanzate: Man mano che emergono nuove tecniche di machine learning, benchmarking la loro efficacia rispetto ai metodi tradizionali sarà importante per capire cosa funziona meglio in vari contesti.
  4. Comprendere Picchi di Carico Occasionali: Un'analisi ulteriore degli aumenti improvvisi nel consumo energetico può aiutare a costruire modelli che meglio anticipano e accolgono cambiamenti imprevisti nella domanda.

Pursuendo queste strade, i ricercatori sperano di migliorare le tecniche di previsione e contribuire a pratiche di gestione energetica più sostenibili negli edifici.

Conclusione

In sintesi, la previsione del carico a breve termine svolge un ruolo vitale nella gestione del consumo energetico per edifici sia residenziali che commerciali. Con l'introduzione di BuildingsBench, i ricercatori hanno ora accesso a un set di dati ricco che può guidare miglioramenti nei metodi di previsione. I primi risultati suggeriscono che i dati sintetici possono integrare i dati del mondo reale, migliorando le prestazioni del modello mentre evidenziano anche la necessità di una continua esplorazione di approcci innovativi per affrontare le sfide uniche poste dai modelli di consumo energetico residenziale.

Il futuro del STLF risiede nel sfruttare ampi set di dati, continuando a perfezionare gli approcci di machine learning e assicurandosi che i modelli possano adattarsi al paesaggio in continua evoluzione dell'uso energetico negli edifici. Concentrandosi su questi obiettivi, la comunità può lavorare verso sistemi energetici più efficienti e sostenibili per il futuro.

Fonte originale

Titolo: BuildingsBench: A Large-Scale Dataset of 900K Buildings and Benchmark for Short-Term Load Forecasting

Estratto: Short-term forecasting of residential and commercial building energy consumption is widely used in power systems and continues to grow in importance. Data-driven short-term load forecasting (STLF), although promising, has suffered from a lack of open, large-scale datasets with high building diversity. This has hindered exploring the pretrain-then-fine-tune paradigm for STLF. To help address this, we present BuildingsBench, which consists of: 1) Buildings-900K, a large-scale dataset of 900K simulated buildings representing the U.S. building stock; and 2) an evaluation platform with over 1,900 real residential and commercial buildings from 7 open datasets. BuildingsBench benchmarks two under-explored tasks: zero-shot STLF, where a pretrained model is evaluated on unseen buildings without fine-tuning, and transfer learning, where a pretrained model is fine-tuned on a target building. The main finding of our benchmark analysis is that synthetically pretrained models generalize surprisingly well to real commercial buildings. An exploration of the effect of increasing dataset size and diversity on zero-shot commercial building performance reveals a power-law with diminishing returns. We also show that fine-tuning pretrained models on real commercial and residential buildings improves performance for a majority of target buildings. We hope that BuildingsBench encourages and facilitates future research on generalizable STLF. All datasets and code can be accessed from https://github.com/NREL/BuildingsBench.

Autori: Patrick Emami, Abhijeet Sahu, Peter Graf

Ultimo aggiornamento: 2024-01-10 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2307.00142

Fonte PDF: https://arxiv.org/pdf/2307.00142

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili