Simple Science

Scienza all'avanguardia spiegata semplicemente

# Statistica# Applicazioni# Intelligenza artificiale

Impatto del Covid-19 sui Trasporti Pubblici a Parigi

Analizzando i cambiamenti nelle abitudini di viaggio a causa dell'influenza della pandemia sui passeggeri.

― 6 leggere min


L'impatto del Covid-19L'impatto del Covid-19sui trasporti a Parigil'affluenza dei mezzi pubblici.Esaminando come la pandemia ha cambiato
Indice

La pandemia di Covid-19 ha avuto un grande impatto su come le persone si spostano dentro le città, soprattutto per quanto riguarda il trasporto pubblico. Questo cambiamento non ha colpito solo i viaggi durante la pandemia, quando erano in atto rigidi Lockdown, ma ha anche modificato le abitudini di viaggio a lungo termine, con più gente che ha iniziato a lavorare da casa. Capire come questi cambiamenti hanno influenzato l'uso del trasporto pubblico ci aiuterà ad analizzare il futuro della mobilità urbana.

In questo articolo, parliamo di un nuovo metodo chiamato Regression Mixture Model che ci aiuta a studiare l'uso del trasporto pubblico a Parigi. Questo modello ci permette di raggruppare le stazioni dei trasporti e identificare diversi periodi temporali tenendo conto di altri fattori, come i giorni di lockdown e le festività, che potrebbero influenzare l'uso.

Panoramica del Modello

Il modello che proponiamo combina Clustering e regressione. Il clustering raggruppa dati simili, mentre la regressione analizza come certi fattori influenzano i risultati. Nel nostro caso, vogliamo vedere come la pandemia ha colpito l'uso del trasporto pubblico esaminando varie stazioni e periodi di tempo.

Clustering e Segmentazione

Il clustering ci aiuta a trovare schemi nei dati raggruppando stazioni con comportamenti di utilizzo simili. La segmentazione, d'altra parte, divide la timeline in diversi periodi basati su cambiamenti di comportamento. Ad esempio, potremmo voler identificare come l'uso è cambiato prima, durante e dopo la pandemia.

Usando il nostro modello, ogni cluster riceve coefficienti di regressione separati per rappresentare l'impatto di altri fattori sull'uso. Questo ci aiuta a vedere come la relazione tra questi fattori cambia nel tempo.

Dati e Metodologia

Raccolta Dati

Abbiamo usato un dataset completo sull'uso del trasporto pubblico a Parigi, raccolto dal 2017 fino a metà 2022. Questo dataset include registrazioni giornaliere della rete ferroviaria, coprendo i viaggi quotidiani da numerose stazioni nella città e nei suoi sobborghi. Include dati da prima della pandemia, durante i lockdown e la fase di ripresa successiva.

Preprocessing dei Dati

I dati grezzi sono stati puliti per garantire accuratezza. Ci siamo concentrati su registrazioni giornaliere scartando i giorni senza dati o con registrazioni insufficienti. In caso di rumore nei dati, abbiamo usato medie mobili per smussare le fluttuazioni. Abbiamo anche normalizzato il dataset per rendere più semplici i confronti.

Variabili esogene

Per migliorare la comprensione delle variazioni nell'uso del nostro modello, abbiamo incluso diversi fattori esterni noti come variabili esogene. Questi includono:

  • Tipo di giorno (ad esempio, giorni feriali contro weekend)
  • Periodi di lockdown specifici
  • Tendenze stagionali durante l'anno
  • Tipo di stazione (ad esempio, metropolitana contro regionale)

Specifica del Modello

Il nostro modello specifica come si comportano i diversi cluster e segmenti. I dati di ogni stazione vengono raggruppati in cluster basati su somiglianze. Questi cluster possono rappresentare diverse aree o tipi di stazioni.

Una volta raggruppati, analizziamo come l'uso cambia nel tempo all'interno di ogni cluster. Il modello ci aiuta a determinare quando si verificano cambiamenti significativi, come durante i lockdown o le fasi di ripresa.

Stima dei Parametri

Abbiamo usato un metodo noto come Expectation-Maximization (EM) per stimare i parametri del modello. Questo metodo ci consente di trovare i parametri che si adattano meglio ai nostri dati. Alterniamo tra la stima dei parametri e il calcolo delle responsabilità di ogni punto nel dataset, che indica quanto è probabile che appartenga a un cluster specifico.

Inizializzazione

Per avviare il processo di stima dei parametri, partiamo con una supposizione per le assegnazioni dei cluster. Man mano che continuiamo a stimare i parametri, perfezioniamo queste supposizioni iniziali per migliorare l'accuratezza del modello.

Risultati

Prestazioni su Dati Sintetici

Per convalidare il nostro modello, l'abbiamo prima testato su dati sintetici, che significa che abbiamo creato dati basati su regole conosciute. Abbiamo poi valutato quanto bene il modello identificava cluster e segmenti. I risultati hanno mostrato che il modello poteva rilevare efficacemente la vera struttura sottostante dei dati.

Valutazione su Dati Reali

Dopo aver convalidato i dati sintetici, abbiamo applicato il modello ai dati reali sull'uso del trasporto pubblico a Parigi. Abbiamo usato un metodo chiamato cross-validation per assicurarci che i nostri risultati fossero affidabili. Questo coinvolge la suddivisione dei dati in set di addestramento e validazione, permettendoci di testare quanto bene il modello prevede nuovi dati.

I risultati hanno indicato che il nostro modello ha superato modelli più semplici che non tenevano conto di fattori esterni. Questo suggerisce che includere variabili come il tipo di giorno e i periodi di lockdown migliora la nostra comprensione dell'uso.

Scoperte

Impatto della Pandemia

Il nostro modello ha rivelato importanti intuizioni sull'impatto della pandemia sul trasporto pubblico. Il lockdown iniziale di marzo 2020 ha causato un forte calo dell'uso in tutte le stazioni. Dopo i lockdown, c'è stata una ripresa graduale, ma non tutte le stazioni sono tornate alla normalità.

Cambiamenti nei Viaggi Durante la Settimana e nel Weekend

Una scoperta chiave è stata che la differenza nell'uso tra giorni feriali e weekend è diventata meno pronunciata dopo la pandemia. Questo potrebbe essere attribuibile al fatto che più persone lavorano da casa, portando a meno pendolari giornalieri.

Variabilità Tra i Cluster

Diverse cluster hanno mostrato schemi di utilizzo distintivi. Le stazioni in aree con livelli di occupazione più elevati hanno visto cambiamenti più significativi a causa delle misure legate alla pandemia. I cluster variavano in termini di quanto il loro utilizzo fluttuava, con alcuni che mostravano maggiore stabilità durante la pandemia.

Conclusione

Il nostro studio ha fornito preziose intuizioni su come la pandemia di Covid-19 ha plasmato l'uso del trasporto pubblico a Parigi. Il Regression Mixture Model ha identificato con successo i cambiamenti nei modelli di viaggio, aiutando funzionari e pianificatori a comprendere gli effetti della pandemia sulla mobilità urbana.

Lavori Futuri

C'è spazio per migliorare il nostro modello, in particolare per quanto riguarda l'efficienza computazionale. Ricerche future potrebbero esplorare modi per ottimizzare i calcoli o automatizzare la selezione del numero di cluster e segmenti.

In generale, comprendere l'impatto della pandemia sul trasporto pubblico è cruciale per prepararsi a future variazioni nei viaggi urbani. Mentre le città si adattano a nuove abitudini lavorative e preferenze di viaggio, le intuizioni di questa ricerca possono aiutare a progettare sistemi di trasporto pubblico migliori che soddisfino le esigenze in evoluzione delle loro popolazioni.

Fonte originale

Titolo: A Regression Mixture Model to understand the effect of the Covid-19 pandemic on Public Transport Ridership

Estratto: The Covid-19 pandemic drastically changed urban mobility, both during the height of the pandemic with government lockdowns, but also in the longer term with the adoption of working-from-home policies. To understand its effects on rail public transport ridership, we propose a dedicated Regression Mixture Model able to perform both the clustering of public transport stations and the segmentation of time periods, while ignoring variations due to additional variables such as the official lockdowns or non-working days. Each cluster is thus defined by a series of segments in which the effect of the exogenous variables is constant. As each segment within a cluster has its own regression coefficients to model the impact of the covariates, we analyze how these coefficients evolve to understand the changes in the cluster. We present the regression mixture model and the parameter estimation using the EM algorithm, before demonstrating the benefits of the model on both simulated and real data. Thanks to a five-year dataset of the ridership in the Paris public transport system, we analyze the impact of the pandemic, not only in terms of the number of travelers but also on the weekly commute. We further analyze the specific changes that the pandemic caused inside each cluster.

Autori: Hugues Moreau, Étienne Côme, Allou Samé, Latifa Oukhellou

Ultimo aggiornamento: 2024-02-16 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2402.12392

Fonte PDF: https://arxiv.org/pdf/2402.12392

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili