Auswirkungen von Covid-19 auf den öffentlichen Verkehr in Paris
Analyse von Veränderungen im Reiseverhalten aufgrund des Einflusses der Pandemie auf die Fahrgastzahlen.
― 6 min Lesedauer
Inhaltsverzeichnis
- Modellübersicht
- Clustering und Segmentierung
- Daten und Methodik
- Datensammlung
- Datenvorverarbeitung
- Exogene Variablen
- Modelspezifikation
- Parameterschätzung
- Initialisierung
- Ergebnisse
- Leistung bei synthetischen Daten
- Bewertung mit echten Daten
- Erkenntnisse
- Auswirkungen der Pandemie
- Veränderungen beim Reisen an Wochentagen und Wochenenden
- Variabilität zwischen Clustern
- Fazit
- Zukünftige Arbeiten
- Originalquelle
- Referenz Links
Die Covid-19-Pandemie hat einen riesigen Einfluss darauf gehabt, wie Leute in Städten reisen, vor allem wenn's um den öffentlichen Nahverkehr geht. Diese Veränderung hat nicht nur die Reisen während der Pandemie betroffen, wo strenge Lockdowns herrschten, sondern auch die langfristigen Reisegewohnheiten verändert, da mehr Leute angefangen haben, von zu Hause aus zu arbeiten. Zu verstehen, wie sich diese Veränderungen auf die Nutzung des öffentlichen Verkehrs ausgewirkt haben, wird uns helfen, die Zukunft der urbanen Mobilität zu analysieren.
In diesem Artikel reden wir über eine neue Methode, die Regression Mixture Model heisst und uns hilft, die Nutzung des öffentlichen Nahverkehrs in Paris zu untersuchen. Dieses Modell ermöglicht es uns, Verkehrsstaationen zu gruppieren und verschiedene Zeitperioden zu identifizieren, während wir andere Faktoren berücksichtigen, wie z. B. Lockdowntage und Feiertage, die die Nutzung beeinflussen könnten.
Modellübersicht
Das Modell, das wir vorschlagen, kombiniert Clustering und Regression. Clustering gruppiert ähnliche Daten, während die Regression untersucht, wie bestimmte Faktoren die Ergebnisse beeinflussen. In unserem Fall wollen wir sehen, wie die Pandemie die Nutzung des öffentlichen Nahverkehrs beeinflusst hat, indem wir verschiedene Stationen und Zeitperioden betrachten.
Clustering und Segmentierung
Clustering hilft uns, Muster in den Daten zu finden, indem es Stationen mit ähnlichem Nutzungsverhalten gruppiert. Segmentierung teilt dagegen den Zeitverlauf in verschiedene Perioden auf, basierend auf Verhaltensänderungen. Zum Beispiel könnten wir herausfinden wollen, wie sich die Nutzung vor, während und nach der Pandemie verändert hat.
Mit unserem Modell erhält jeder Cluster separate Regressionskoeffizienten, um die Auswirkungen anderer Faktoren auf die Nutzung darzustellen. Das hilft uns zu sehen, wie sich die Beziehung zwischen diesen Faktoren im Laufe der Zeit verändert.
Daten und Methodik
Datensammlung
Wir haben einen umfassenden Datensatz zur Nutzung des öffentlichen Nahverkehrs in Paris verwendet, der von 2017 bis Mitte 2022 gesammelt wurde. Dieser Datensatz umfasst tägliche Einträge zum Schienennetz und deckt tägliche Fahrten von zahlreichen Stationen in der Stadt und deren Vororten ab. Er enthält Daten von vor der Pandemie, während der Lockdowns und der Erholungsphase danach.
Datenvorverarbeitung
Die Rohdaten wurden gereinigt, um die Genauigkeit sicherzustellen. Wir haben uns auf tägliche Einträge konzentriert und Tage mit fehlenden Daten oder ungenügenden Einträgen ausgeschlossen. Wenn es Rauschen in den Daten gab, haben wir gleitende Durchschnitte verwendet, um die Schwankungen zu glätten. Wir haben auch den Datensatz normalisiert, um Vergleiche einfacher zu machen.
Exogene Variablen
Um unser Verständnis der Veränderungen in der Nutzung zu verbessern, haben wir mehrere externe Faktoren, auch exogene Variablen genannt, einbezogen. Dazu gehören:
- Art des Tages (z. B. Wochentage vs. Wochenenden)
- Bestimmte Lockdown-Perioden
- Saisonale Trends im Laufe des Jahres
- Stationstyp (z. B. U-Bahn vs. Regional)
Modelspezifikation
Unser Modell spezifiziert, wie sich verschiedene Cluster und Segmente verhalten. Die Daten jeder Station werden in Cluster gruppiert, basierend auf Ähnlichkeiten. Diese Cluster können verschiedene Bereiche oder Arten von Stationen repräsentieren.
Sobald die Cluster gebildet sind, analysieren wir, wie sich die Nutzung im Laufe der Zeit innerhalb jedes Clusters verändert. Das Modell hilft uns zu bestimmen, wann signifikante Veränderungen auftreten, wie während der Lockdowns oder der Erholungsphasen.
Parameterschätzung
Wir haben eine Methode namens Erwartungs-Maximierung (EM) verwendet, um die Parameter des Modells zu schätzen. Diese Methode ermöglicht es uns, die am besten passenden Parameter basierend auf unseren Daten zu finden. Wir wechseln zwischen der Schätzung der Parameter und der Berechnung der Verantwortlichkeiten jedes Punktes im Datensatz, was zeigt, wie wahrscheinlich es ist, dass er zu einem bestimmten Cluster gehört.
Initialisierung
Um den Prozess zur Parameterschätzung zu starten, beginnen wir mit einer Schätzung der Clusterzuweisungen. Während wir die Parameter weiter schätzen, verfeinern wir diese ersten Schätzungen, um die Genauigkeit des Modells zu verbessern.
Ergebnisse
Leistung bei synthetischen Daten
Um unser Modell zu validieren, haben wir es zuerst mit synthetischen Daten getestet, was bedeutet, dass wir Daten basierend auf bekannten Regeln erstellt haben. Dann haben wir bewertet, wie gut das Modell Cluster und Segmente identifiziert hat. Die Ergebnisse zeigten, dass das Modell die wahre zugrunde liegende Struktur der Daten effektiv erkennen konnte.
Bewertung mit echten Daten
Nachdem wir an synthetischen Daten validiert hatten, haben wir das Modell auf echte Daten zur Nutzung des öffentlichen Nahverkehrs in Paris angewendet. Wir haben eine Methode namens Kreuzvalidierung verwendet, um sicherzustellen, dass unsere Ergebnisse zuverlässig waren. Dabei wurde der Datensatz in Trainings- und Validierungssets unterteilt, sodass wir testen konnten, wie gut das Modell neue Daten vorhersagt.
Die Ergebnisse deuteten darauf hin, dass unser Modell besser abschnitt als einfachere Modelle, die externe Faktoren nicht berücksichtigt haben. Das legt nahe, dass die Einbeziehung von Variablen wie Tagesart und Lockdown-Perioden unser Verständnis der Nutzung verbessert.
Erkenntnisse
Auswirkungen der Pandemie
Unser Modell zeigte erhebliche Erkenntnisse über die Auswirkungen der Pandemie auf den öffentlichen Nahverkehr. Der anfängliche Lockdown im März 2020 führte zu einem starken Rückgang der Nutzung in allen Stationen. Nach den Lockdowns gab es eine allmähliche Erholung, aber nicht alle Stationen normalisierten sich.
Veränderungen beim Reisen an Wochentagen und Wochenenden
Eine wichtige Erkenntnis war, dass der Unterschied in der Nutzung zwischen Wochentagen und Wochenenden nach der Pandemie weniger ausgeprägt wurde. Das könnte daran liegen, dass mehr Leute von zu Hause aus arbeiten, was zu weniger täglichen Pendlern führt.
Variabilität zwischen Clustern
Verschiedene Cluster zeigten unterschiedliche Nutzungsmuster. Stationen in Gebieten mit höheren Beschäftigungslevels erlebten grössere Veränderungen aufgrund pandemiebedingter Massnahmen. Die Cluster variierten darin, wie stark ihre Nutzung schwankte, wobei einige während der Pandemie stabiler waren.
Fazit
Unsere Studie lieferte wertvolle Einblicke darin, wie die Covid-19-Pandemie die Nutzung des öffentlichen Nahverkehrs in Paris umgestaltet hat. Das Regression Mixture Model identifizierte erfolgreich Veränderungen in den Reisegewohnheiten und half Beamten und Planern, die Auswirkungen der Pandemie auf die urbane Mobilität zu verstehen.
Zukünftige Arbeiten
Es gibt noch Verbesserungspotenzial in unserem Modell, vor allem was die rechnerische Effizienz angeht. Zukünftige Forschungen könnten Möglichkeiten erkunden, die Berechnungen zu optimieren oder die Auswahl der Anzahl der Cluster und Segmente zu automatisieren.
Insgesamt ist es wichtig, die Auswirkungen der Pandemie auf den öffentlichen Nahverkehr zu verstehen, um sich auf zukünftige Veränderungen im städtischen Reisen vorzubereiten. Während Städte sich an neue Arbeitsgewohnheiten und Reisepräferenzen anpassen, können die Erkenntnisse aus dieser Forschung dabei helfen, bessere öffentliche Verkehrssysteme zu entwerfen, die den sich wandelnden Bedürfnissen ihrer Bevölkerung gerecht werden.
Titel: A Regression Mixture Model to understand the effect of the Covid-19 pandemic on Public Transport Ridership
Zusammenfassung: The Covid-19 pandemic drastically changed urban mobility, both during the height of the pandemic with government lockdowns, but also in the longer term with the adoption of working-from-home policies. To understand its effects on rail public transport ridership, we propose a dedicated Regression Mixture Model able to perform both the clustering of public transport stations and the segmentation of time periods, while ignoring variations due to additional variables such as the official lockdowns or non-working days. Each cluster is thus defined by a series of segments in which the effect of the exogenous variables is constant. As each segment within a cluster has its own regression coefficients to model the impact of the covariates, we analyze how these coefficients evolve to understand the changes in the cluster. We present the regression mixture model and the parameter estimation using the EM algorithm, before demonstrating the benefits of the model on both simulated and real data. Thanks to a five-year dataset of the ridership in the Paris public transport system, we analyze the impact of the pandemic, not only in terms of the number of travelers but also on the weekly commute. We further analyze the specific changes that the pandemic caused inside each cluster.
Autoren: Hugues Moreau, Étienne Côme, Allou Samé, Latifa Oukhellou
Letzte Aktualisierung: 2024-02-16 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2402.12392
Quell-PDF: https://arxiv.org/pdf/2402.12392
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.