Mappare i modelli di viaggio in taxi a Chicago
Uno studio sulle corse in taxi di Chicago rivela la connettività dei quartieri e le tendenze di viaggio.
― 4 leggere min
Indice
I modelli di mobilità umana sono super importanti in tanti campi, come la pianificazione urbana, la salute pubblica e l'organizzazione delle comunità. Una fonte preziosa per studiare questi modelli è rappresentata dai dati delle corse in taxi. Concentrandoci su Chicago, abbiamo analizzato le corse in taxi del 2016 per vedere come i diversi Quartieri siano collegati attraverso i viaggi in taxi.
L'obiettivo di questa analisi è identificare quali quartieri le persone attraversano usando i taxi. Queste informazioni possono aiutare a informare nuovi progetti di trasporto pubblico e migliorare la gestione del traffico. Mappando i modelli di traffico, possiamo capire da dove vengono le persone e dove stanno andando, il che potrebbe essere utile per ridurre il traffico e l'inquinamento.
Nel nostro studio, abbiamo rappresentato i dati come un grafo, dove i quartieri sono i nodi e i tempi di viaggio in taxi sono i bordi. Per la nostra analisi, abbiamo usato un grafo diretto per mostrare il flusso delle corse in taxi da un quartiere all'altro.
Raccolta Dati
Abbiamo utilizzato i dati delle corse in taxi del 2016, che sono stati riportati alla città di Chicago e resi disponibili online. Questo dataset include dettagli su dove sono iniziate e terminate le corse in taxi. Avevamo quasi 1,3 milioni di record, permettendoci di costruire un grafo con 77 nodi che rappresentano i quartieri di Chicago.
Raggruppamento di Grafi Non Diretti
Per raggruppare i quartieri in base ai modelli di viaggio in taxi, prima abbiamo dovuto convertire il nostro grafo diretto in un grafo non diretto. Questo è stato fatto trattando ogni corsa tra due quartieri come un contributo al peso del bordo, indipendentemente dalla direzione di viaggio. Abbiamo poi applicato diversi Algoritmi di clustering per identificare gruppi di quartieri.
Clustering Spettroscopico
Il clustering spettroscopico è un metodo che usa le proprietà matematiche dei grafi per identificare i cluster. Si tratta di calcolare valori specifici chiamati autovalori da una matrice che rappresenta il grafo. Questi autovalori ci aiutano a raggruppare i quartieri in cluster.
Algoritmo Leiden
L'algoritmo Leiden è un altro approccio di clustering che si concentra sulla struttura del grafo. Funziona regolando ripetutamente i cluster in base alle connessioni tra i nodi. Questo metodo aiuta a trovare cluster più stabili e significativi.
Algoritmo Walktrap
L'algoritmo Walktrap usa un approccio diverso simulando camminate casuali attraverso il grafo. Identifica i cluster osservando dove tendono a radunarsi queste camminate, trovando le parti densamente collegate del grafo.
Raggruppamento di Grafi Diretti
Poiché stiamo lavorando con grafi diretti, abbiamo bisogno di metodi che tengano conto della direzione delle corse in taxi. Possono essere applicate diverse tecniche ai grafi diretti:
Trasformazione Semplice
Questo metodo crea un grafo non diretto ignorando la direzione dei bordi. Anche se è semplice, potrebbe trascurare informazioni chiave fornite dalla direzionalità.
Simmetrizzazione Bibliometrica
Questo approccio trasforma il grafo diretto in uno simmetrico combinando informazioni sulle connessioni in entrata e in uscita. Questo aiuta a catturare modelli che verrebbero persi usando metodi più semplici.
Laplaciano Diretto
Un metodo più avanzato usa una versione diretta della matrice Laplaciana. Questo consente un'analisi più approfondita del grafo, tenendo conto della direzione dei bordi mentre identifica i cluster.
Clustering Spettroscopico SVD
Questo metodo applica la decomposizione ai valori singolari alla matrice di adiacenza del grafo diretto. Cerca di trovare un'approssimazione a basso rango della matrice, che consente un clustering efficace dei quartieri.
Clustering Spettroscopico di Camminata Casuale
Utilizzando la matrice di transizione del grafo diretto, questo metodo si concentra sugli autovalori e sugli autovettori per trovare cluster. Usa il secondo autovalore più grande per aiutare a partizionare il grafo in gruppi significativi.
Risultati e Conclusioni
Dopo aver applicato vari algoritmi di clustering, abbiamo analizzato i risultati. Per i grafi non diretti, abbiamo scoperto che alcuni metodi, come il clustering spettroscopico con il Laplaciano non normalizzato e l'algoritmo Leiden, non hanno prodotto cluster chiari, identificando principalmente nodi anomali. Questo potrebbe essere dovuto all'alta connettività e ai pesi variabili nel grafo.
Tuttavia, quando abbiamo utilizzato il Laplaciano normalizzato e l'algoritmo Walktrap, siamo riusciti a identificare due cluster distinti. L'accordo tra questi due metodi suggerisce un certo livello di affidabilità in queste scoperte.
Passando ai grafi diretti, abbiamo osservato schemi simili. Tutti gli algoritmi hanno identificato un cluster con molti bordi in entrata, mentre altri cluster mostrano meno connessioni. Questa coerenza tra i diversi metodi indica che possiamo fidarci di questi risultati.
Direzioni Future
Nel lavoro futuro, potremmo analizzare ulteriormente i dati separandoli in modelli durante la settimana e nel weekend. Questo potrebbe far luce su come varia il flusso del traffico nel corso della settimana, fornendo approfondimenti più dettagliati sulla mobilità umana a Chicago.
Titolo: Understanding human mobility patterns in Chicago: an analysis of taxi data using clustering techniques
Estratto: Understanding human mobility patterns is important in applications as diverse as urban planning, public health, and political organizing. One rich source of data on human mobility is taxi ride data. Using the city of Chicago as a case study, we examine data from taxi rides in 2016 with the goal of understanding how neighborhoods are interconnected. This analysis will provide a sense of which neighborhoods individuals are using taxis to travel between, suggesting regions to focus new public transit development efforts. Additionally, this analysis will map traffic circulation patterns and provide an understanding of where in the city people are traveling from and where they are heading to - perhaps informing traffic or road pollution mitigation efforts. For the first application, representing the data as an undirected graph will suffice. Transit lines run in both directions so simply a knowledge of which neighborhoods have high rates of taxi travel between them provides an argument for placing public transit along those routes. However, in order to understand the flow of people throughout a city, we must make a distinction between the neighborhood from which people are departing and the areas to which they are arriving - this requires methods that can deal with directed graphs. All developed codes can be found at https://github.com/Nikunj-Gupta/Spectral-Clustering-Directed-Graphs.
Autori: Harish Chauhan, Nikunj Gupta, Zoe Haskell-Craig
Ultimo aggiornamento: 2023-06-21 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2306.12094
Fonte PDF: https://arxiv.org/pdf/2306.12094
Licenza: https://creativecommons.org/publicdomain/zero/1.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.