Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Maschinelles Lernen

Fortschritte in der Kurzzeitlastprognose

Neuer Datensatz verbessert die Energievoraussagemethoden für Gebäude.

― 10 min Lesedauer


EnergieprognoseEnergieprognoseGenauigkeitverbessernEnergieverbrauchsprognosen.Neuer Datensatz verbessert kurzfristige
Inhaltsverzeichnis

Die kurzfristige Lastprognose (STLF) ist der Prozess, bei dem vorhergesagt wird, wie viel Energie Gebäude in naher Zukunft verbrauchen werden, typischerweise von einer Stunde bis zu ein paar Tagen im Voraus. Diese Art der Prognose ist wichtig für Energiemanagementsysteme, um das Angebot mit der Nachfrage abzugleichen und Preise auf den Energiemärkten festzulegen. Mit dem Wachstum von Smart Metern und fortschrittlichen Sensoren gibt es ein zunehmendes Interesse an datengestützten Methoden zur Verbesserung der Genauigkeit. Allerdings haben viele Studien Probleme gehabt, weil es an verfügbaren grossen Datensätzen mangelt, die eine Vielzahl von Gebäudetypen und -bedingungen repräsentieren.

Der Bedarf an grossen Datensätzen

Viele Ansätze zur STLF basieren auf maschinellem Lernen und anderen datengestützten Techniken, um Vorhersagen zu treffen. Diese Methoden benötigen jedoch oft eine Menge Daten, um gut zu funktionieren, insbesondere wenn sie auf unterschiedlichen Gebäudetypen trainiert werden sollen. Leider sind die meisten verfügbaren Datensätze klein und decken möglicherweise nicht genug Vielfalt in Bezug auf geografische Lage, Gebäudetyp oder Belegungsmuster ab. Diese mangelnde Diversität macht es schwierig, effektive Modelle zu erstellen, die gut auf verschiedene Gebäude verallgemeinerbar sind.

Um diese Lücke zu schliessen, haben Forscher einen neuen Datensatz namens BuildingsBench entwickelt. Dieser Datensatz umfasst Daten zum Energieverbrauch von 900.000 simulierten Gebäuden in den Vereinigten Staaten. Er enthält ausserdem eine Sammlung von echten Gebäudedaten, um die Wirksamkeit von Prognosemodellen zu evaluieren.

Überblick über BuildingsBench

BuildingsBench ist ein gross angelegter Datensatz, der darauf abzielt, die kurzfristige Lastprognose zu verbessern. Er besteht aus zwei Hauptkomponenten:

  1. Buildings-900K: Ein Datensatz mit 900.000 simulierten Gebäuden, die eine breite Palette von Gebäudetypen und Energieverbrauchsprofilen repräsentieren.
  2. Evaluierungsplattform: Eine Sammlung von über 1.900 echten Wohn- und Gewerbegebäuden, die aus sieben offenen Datensätzen gesammelt wurden.

Der Datensatz ermöglicht es Forschern, verschiedene Prognosemethoden zu benchmarken, einschliesslich neuer Techniken, die zuvor nicht umfassend getestet wurden. Er untersucht auch zwei spezifische Aufgaben: Zero-Shot STLF, bei dem Modelle Lasten für unbekannte Gebäude ohne Anpassung vorhersagen, und Transferlernen, bei dem Modelle mit Daten von spezifischen Gebäuden weiter angepasst werden.

Bedeutung genauer Prognosen

Wohn- und Gewerbegebäude machen einen erheblichen Teil des Energieverbrauchs und der Treibhausgasemissionen aus. In den Vereinigten Staaten sind Gebäude für etwa 40 % des Energieverbrauchs und 35 % der Emissionen verantwortlich. Weltweit liegen diese Zahlen bei etwa 30 % und 27 %. Den Energieverbrauch in Gebäuden zu reduzieren, spielt eine entscheidende Rolle im Kampf gegen den Klimawandel und beim Erreichen von Nachhaltigkeitszielen.

Genauige kurzfristige Lastprognosen können helfen, das Management von Energieressourcen zu optimieren. Sie können auch bei der Planung der Integration erneuerbarer Energien unterstützen, um sicherzustellen, dass das Angebot die Nachfrage effektiv deckt, und die Kosten für die Energieversorgung zu minimieren.

Die Datensätze im Detail

Buildings-900K

Buildings-900K stammt aus einer Datenbank, die als National Renewable Energy Laboratory (NREL) End-Use Load Profiles (EULP) bekannt ist. Dieser Datensatz enthält Daten zum Energieverbrauch, die in 15-Minuten-Intervallen simuliert wurden und Tausende von Gebäuden in unterschiedlichen Klimazonen in den USA repräsentieren. Die Gebäude wurden sorgfältig modelliert, um nicht nur ihre Energieverbrauchsmuster, sondern auch sozioökonomische Faktoren wie Standort und Gebäudeeigenschaften widerzuspiegeln.

Um den Datensatz handhabbar zu machen, haben die Forscher die Daten auf eine stündliche Auflösung aggregiert, wodurch die Grösse reduziert wurde, während wesentliche Details erhalten blieben. Der gesamte Datensatz ist ungefähr 110 GB gross, was einen einfacheren Zugriff und eine einfachere Nutzung in der Forschung ermöglicht.

Der Datensatz ermöglicht es Forschern, viele verschiedene Aspekte des Energieverbrauchs zu untersuchen, einschliesslich, wie Gebäudetyp, Standort und Belegung die Energieverbrauchsmuster verändern.

Evaluierungsplattform mit realen Gebäuden

Neben den simulierten Daten umfasst die Evaluierungsplattform Daten von 1.900 echten Gebäuden. Diese Gebäude stammen aus verschiedenen Studien und Projekten und bieten zusätzlichen Kontext, um zu verstehen, wie Modelle mit realen Daten abschneiden. Durch den Vergleich der Vorhersagen auf simulierten und echten Datensätzen können Forscher besser abschätzen, wie effektiv ihre Prognosemodelle sind.

Die Datensätze von echten Gebäuden wurden sorgfältig ausgewählt, um eine breite Palette von Bedingungen zu gewährleisten, damit sie die simulierten Daten gut ergänzen. Diese Diversität erhöht die Robustheit der Forschungsergebnisse und trägt zu zuverlässigeren Prognosetechniken bei.

Wie STLF-Modelle funktionieren

Im Kern stützt sich die kurzfristige Lastprognose auf historische Daten, um Vorhersagen über den zukünftigen Energieverbrauch zu treffen. STLF-Modelle analysieren vergangene Lasten und verschiedene andere Faktoren, wie den Wochentag, die Tageszeit und die Wetterbedingungen, um den zukünftigen Energieverbrauch vorherzusagen.

Zero-Shot-Vorhersage

Bei der Zero-Shot-STLF wird den Modellen die Aufgabe gestellt, Energieverbrauch für Gebäude vorherzusagen, die sie zuvor noch nie gesehen haben. Dieses Szenario ist besonders nützlich, um Modelle schnell in neuen Umgebungen einzusetzen, in denen nur begrenzte Daten zur Feinabstimmung verfügbar sind. Es ermöglicht eine effiziente Bereitstellung und kann die Zeit, die benötigt wird, um Energiemanagementsysteme in neu instrumentierten Gebäuden zu integrieren, erheblich verkürzen.

Transferlernen

Transferlernen stellt einen anderen Ansatz dar, bei dem ein Modell, das auf einem grossen Datensatz (wie Buildings-900K) vortrainiert wurde, mit einer begrenzten Menge an Daten von einem spezifischen Gebäude weiter angepasst wird. Diese Methode nutzt das allgemeine Wissen, das das Modell erworben hat, und passt es an den neuen, spezifischen Kontext an. Oft führt dies zu einer besseren Leistung als das Training eines Modells von Grund auf, insbesondere wenn die Daten begrenzt sind.

Bewertung der STLF-Modelle

Um sicherzustellen, dass die Modelle genau arbeiten, werden verschiedene Metriken verwendet, um ihre Wirksamkeit zu bewerten. Zwei Hauptmetriken sind:

  • Normalisierte Wurzelmittelquadratische Abweichung (NRMSE): Diese Metrik bewertet, wie nah die prognostizierten Werte an den tatsächlichen Verbrauchswerten liegen. Ein niedrigerer NRMSE zeigt eine bessere Leistung an.
  • Bewerteter Wahrscheinlichkeitswert (RPS): Diese Metrik wird verwendet, um die Unsicherheit der Vorhersagen zu bewerten. Sie vergleicht die vorhergesagte Verteilung der Energiebelastungen mit den tatsächlich beobachteten Werten und hilft einzuschätzen, wie gut das Modell die Variabilität in den Lastprognosen berücksichtigen kann.

Durch die Verwendung dieser Metriken können Forscher identifizieren, welche Modelle effektiver im Vorhersagen des Energieverbrauchs sind und unter welchen Bedingungen sie am besten abschneiden.

Ergebnisse von BuildingsBench

Die frühen Ergebnisse von Tests mit verschiedenen Modellen auf dem BuildingsBench-Datensatz haben vielversprechende Erkenntnisse gezeigt. Vortrainierte Modelle, insbesondere solche, die die Transformer-Architektur nutzen, haben eine starke Fähigkeit gezeigt, sich an echte Gebäude nach dem Vortraining mit simulierten Daten anzupassen.

Zero-Shot-STLF-Ergebnisse

In den Zero-Shot-Vorhersagetests zeigten die Modelle gute Leistungen bei der Vorhersage von Lasten für unbekannte Gebäude, insbesondere für gewerbliche. Modelle, die auf Buildings-900K trainiert wurden, konnten ihr Lernen verallgemeinern und starke Vorhersagen für die Testgebäude liefern, was zur Erkenntnis beiträgt, dass synthetisches Vortraining für die Prognose von gewerblichen Gebäuden effektiv sein kann.

Die Leistung bei Wohngebäuden war jedoch variabler, was die Herausforderungen hervorhebt, die durch die inhärente Unvorhersehbarkeit des Wohnenergieverbrauchs entstehen. Es ist üblich, dass Wohnlasten erheblich schwanken, abhängig vom Verhalten der Bewohner und anderen nicht beobachtbaren Faktoren.

Transferlernen Ergebnisse

Beim Transferlernen führte die Feinabstimmung vortrainierter Modelle mit begrenzten Daten von spezifischen Gebäuden zu bemerkenswerten Verbesserungen in der Genauigkeit. Die Ergebnisse deuteten darauf hin, dass es entscheidend war, allen Schichten eines Modells zu erlauben, verfeinert zu werden, da die Feinabstimmung nur der letzten Schicht oft zu schlechterer Genauigkeit führte.

Diese Ergebnisse legen nahe, dass die Fähigkeit eines Modells, sich anzupassen und aus spezifischen Gebäudedaten zu lernen, entscheidend ist, um bessere Prognosenergebnisse zu erzielen.

Einblicke in die Datensätze

Die Analyse der Datensätze offenbarte interessante Muster. Grössere und vielfältigere Datensätze führten im Allgemeinen zu einer besseren Modellleistung. Es gab jedoch einen Punkt abnehmender Erträge, was bedeutet, dass eine blosse Vergrösserung der Datengrösse nicht immer zu signifikanten Verbesserungen in der Genauigkeit führt.

Im Gegensatz dazu spielte auch die Wahl der Modellgrösse eine Rolle für die Leistung. Kleinere Modelle schnitten oft bei bestimmten Aufgaben besser ab, insbesondere im Kontext von Wohngebäuden. Das deutet darauf hin, dass ein verfeinerter Ansatz beim Modellbau zu einer verbesserten Genauigkeit führen könnte, insbesondere beim Umgang mit rauschenden Wohn-energiedaten.

Herausforderungen bei der Prognose von Wohngebäuden

Die Prognose des Energieverbrauchs von Wohngebäuden stellt eine andere Reihe von Herausforderungen dar als bei gewerblichen Gebäuden. Die Variabilität, die mit dem Verhalten der Bewohner, lokalen Wetterbedingungen und der Nutzung von Gebäuden verbunden ist, macht die kurzfristige Lastprognose komplexer.

Viele Studien haben festgestellt, dass Modelle Schwierigkeiten haben, gut auf Wohngebäude zu verallgemeinern, weil sie oft stark auf historischen Lastdaten basieren. Die Variabilität im Energieverbrauch je nach Verhalten der Bewohner bedeutet, dass es oft weniger Vorhersehbarkeit gibt als bei gewerblichen Gebäuden, die tendenziell stabilere Nutzungsmuster aufweisen.

Daher schauen Forscher nach neuen Ansätzen, einschliesslich der Berücksichtigung zusätzlicher Datentypen wie Wetterbedingungen und andere relevante Variablen, um die Modellgenauigkeit für Wohngebäude zu verbessern.

Richtungen für zukünftige Forschung

Mit der Einführung von BuildingsBench hat das Feld der kurzfristigen Lastprognose jetzt die Möglichkeit für reichhaltigere und vielfältigere Forschungen. Einige potenzielle zukünftige Forschungsrichtungen umfassen:

  1. Inkorporierung von Wetterdaten: Die Einbeziehung von Wettermodellen kann ein klareres Bild davon vermitteln, wie äussere Bedingungen den Energieverbrauch von Gebäuden beeinflussen, was die Modellgenauigkeit erhöht.
  2. Kombinieren von synthetischen und realen Daten: Eine Mischung aus simulierten Daten und tatsächlichen Gebäudedaten könnte die Stärken beider nutzen, um robustere Prognosemodelle zu erstellen.
  3. Benchmarking fortgeschrittener Techniken: Wenn neue maschinelle Lerntechniken auftauchen, wird es wichtig sein, ihre Wirksamkeit im Vergleich zu traditionellen Methoden zu bewerten, um zu verstehen, was in verschiedenen Kontexten am besten funktioniert.
  4. Verstehen von sporadischen Lastspitzen: Eine weitere Analyse plötzlicher Anstiege im Energieverbrauch kann helfen, Modelle zu entwickeln, die besser in der Lage sind, unerwartete Änderungen in der Nachfrage vorherzusehen und zu berücksichtigen.

Durch das Verfolgen dieser Möglichkeiten hoffen die Forscher, Prognosetechniken zu verbessern und zu nachhaltigeren Energiemanagementpraktiken in Gebäuden beizutragen.

Fazit

Zusammenfassend spielt die kurzfristige Lastprognose eine entscheidende Rolle beim Management des Energieverbrauchs für sowohl Wohn- als auch Gewerbegebäude. Mit der Einführung von BuildingsBench haben Forscher jetzt Zugang zu einem umfangreichen Datensatz, der Verbesserungen in den Prognosemethoden vorantreiben kann. Die ersten Ergebnisse deuten darauf hin, dass synthetische Daten echte Daten ergänzen können, was die Modellleistung verbessert und gleichzeitig die Notwendigkeit zur kontinuierlichen Erforschung innovativer Ansätze zur Bewältigung der einzigartigen Herausforderungen hervorhebt, die durch die Muster des Wohnenergieverbrauchs entstehen.

Die Zukunft der STLF liegt darin, umfangreiche Datensätze zu nutzen, maschinelle Lernansätze weiter zu verfeinern und sicherzustellen, dass Modelle sich an die sich ständig ändernde Landschaft des Energieverbrauchs in Gebäuden anpassen können. Indem die Gemeinschaft sich auf diese Ziele konzentriert, kann sie auf effizientere und nachhaltigere Energiesysteme für die Zukunft hinarbeiten.

Originalquelle

Titel: BuildingsBench: A Large-Scale Dataset of 900K Buildings and Benchmark for Short-Term Load Forecasting

Zusammenfassung: Short-term forecasting of residential and commercial building energy consumption is widely used in power systems and continues to grow in importance. Data-driven short-term load forecasting (STLF), although promising, has suffered from a lack of open, large-scale datasets with high building diversity. This has hindered exploring the pretrain-then-fine-tune paradigm for STLF. To help address this, we present BuildingsBench, which consists of: 1) Buildings-900K, a large-scale dataset of 900K simulated buildings representing the U.S. building stock; and 2) an evaluation platform with over 1,900 real residential and commercial buildings from 7 open datasets. BuildingsBench benchmarks two under-explored tasks: zero-shot STLF, where a pretrained model is evaluated on unseen buildings without fine-tuning, and transfer learning, where a pretrained model is fine-tuned on a target building. The main finding of our benchmark analysis is that synthetically pretrained models generalize surprisingly well to real commercial buildings. An exploration of the effect of increasing dataset size and diversity on zero-shot commercial building performance reveals a power-law with diminishing returns. We also show that fine-tuning pretrained models on real commercial and residential buildings improves performance for a majority of target buildings. We hope that BuildingsBench encourages and facilitates future research on generalizable STLF. All datasets and code can be accessed from https://github.com/NREL/BuildingsBench.

Autoren: Patrick Emami, Abhijeet Sahu, Peter Graf

Letzte Aktualisierung: 2024-01-10 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2307.00142

Quell-PDF: https://arxiv.org/pdf/2307.00142

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel