Sistema di tracciamento veicoli sull'Interstate 24
Un sistema che combina video e dati GPS per il tracciamento dei veicoli sull'Interstate 24.
― 7 leggere min
Indice
- Dataset e Sistemi di Coordinate
- Conversione da Immagine a Piano Statale
- Conversione da Piano Statale a Coordinate Stradali
- Etichettatura dei Punti di Corrispondenza
- Adattamento della Spline della Linea Centrale
- Metodi di Riesame dell'Omarografia
- Metriche di Errore dell'Omarografia
- Dettagli Sperimentali
- Trattamento delle Informazioni Personali Identificabili
- Artefatti e Anomalie Dati Conosciuti
- Conclusione
- Fonte originale
- Link di riferimento
Questo articolo parla di un sistema progettato per tracciare i veicoli sull'Interstate 24 usando vari tipi di dati e metodi. Spiega come i dati video, le info GPS e tecniche speciali siano combinati per creare un modello accurato dei movimenti dei veicoli. Comprendendo questi metodi, possiamo migliorare la sicurezza e l'efficienza dei trasporti.
Dataset e Sistemi di Coordinate
Il sistema di tracciamento dei veicoli utilizza diversi sistemi di coordinate per rappresentare le posizioni. Ci sono tre tipi principali:
Coordinate Immagine: Queste coordinate si basano sui pixel del video. Il pixel in alto a sinistra è annotato come (0, 0) e tutti gli altri pixel sono definiti dai loro numeri di riga e colonna.
Coordinate Piano Statale: Questo sistema utilizza un metodo specifico per misurare le distanze in piedi. Si basa su una superficie piana ed è composto da due assi principali: uno che corre da est a ovest e un altro che corre da nord a sud. La distanza dalla superficie stradale è misurata utilizzando un terzo asse.
Coordinate Stradali: Questo sistema si concentra sulla strada stessa. L'asse principale corre lungo il centro della strada, mentre l'asse secondario è perpendicolare a esso. I punti più vicini al centro della strada hanno coordinate uniche.
Questi sistemi di coordinate aiutano a convertire i dati da una forma all'altra in modo efficace.
Conversione da Immagine a Piano Statale
Quando si convertono dati da coordinate immagine a coordinate piano statale, si utilizza un processo chiamato omografia. L'omografia ci permette di mettere in relazione due diverse viste di una superficie piana, aiutandoci a proiettare punti dal video nel piano statale.
Per creare un'omografia per ogni telecamera, si identificano punti distinti chiamati punti di corrispondenza nel video e nel piano statale. Questi punti aiutano a definire una mappatura lineare tra i due sistemi.
Il processo consiste in:
- Identificare coppie di punti nel video e nel piano statale.
- Adattare un modello matematico a questi punti.
- Applicare il modello per convertire i punti dal video in coordinate del piano statale.
Conversione da Piano Statale a Coordinate Stradali
Una volta che i dati sono nelle coordinate del piano statale, possono essere ulteriormente convertiti in coordinate stradali. Questa conversione è particolarmente rilevante per rappresentare i veicoli come scatole di delimitazione 3D.
Una scatola di delimitazione è una forma rettangolare che racchiude un veicolo nello spazio 3D. Per convertire le dimensioni della scatola di delimitazione da coordinate del piano statale a coordinate stradali, si utilizzano metodi chiave:
- Definire gli angoli della scatola di delimitazione nelle coordinate del piano statale.
- Utilizzare le dimensioni medie del veicolo per determinare le coordinate corrispondenti sulla strada.
- Identificare il punto più vicino sulla linea centrale della strada per una posizionamento accurato.
Seguendo questo metodo, la scatola di delimitazione può essere posizionata con precisione all'interno del sistema di coordinate stradali.
Etichettatura dei Punti di Corrispondenza
Per garantire misurazioni precise, i punti di corrispondenza sono etichettati con precisione all'interno del campo visivo di ogni telecamera. Questo viene fatto utilizzando un processo di etichettatura manuale, assistito da strumenti software.
I passaggi chiave includono:
- Selezionare punti di riferimento facilmente riconoscibili sulla strada, come le segnature delle corsie.
- Utilizzare un'interfaccia grafica per contrassegnare i punti nei fotogrammi video.
- Memorizzare le coordinate di questi punti insieme alle loro coordinate GPS corrispondenti per un uso successivo.
Questa etichettatura sistematica consente di tracciare costantemente le posizioni dei veicoli attraverso diverse viste della telecamera.
Adattamento della Spline della Linea Centrale
Mentre i veicoli si muovono lungo la strada, viene utilizzata una spline della linea centrale per rappresentare la curvatura della strada.
Per adattare la spline della linea centrale, vengono eseguiti i seguenti passaggi:
- Identificare punti chiave lungo la strada, come le linee gialle, e etichettarli.
- Utilizzare questi punti per adattare una curva liscia che rappresenti la linea centrale della strada.
- Campionare punti aggiuntivi lungo questa spline per creare una rappresentazione accurata della geometria della strada.
Questa spline aiuta nel posizionamento preciso dei veicoli e facilita la conversione tra i diversi sistemi di coordinate.
Metodi di Riesame dell'Omarografia
Nel tempo, l'accuratezza delle omografie può diminuire a causa di vari fattori, come il movimento della telecamera o cambiamenti ambientali. Per mantenere l'accuratezza, viene implementato un sistema per il riesame delle omografie.
Re-identificazione dei Punti Caratteristici
Questo metodo prevede di riscoprire i punti caratteristici all'interno dell'immagine per garantire che siano allineati strettamente con la verità di base.
Il processo di riesame include:
- Estrarre un'immagine di sfondo per rimuovere oggetti temporanei come veicoli.
- Utilizzare algoritmi per trovare punti caratteristici che corrispondano a punti di riferimento precedentemente identificati.
- Calcolare una nuova omografia basata su questi punti riscoperti.
Generazione di Omografia Statica
Per gestire i cambiamenti a lungo termine nell'ambiente, può essere generata un'omografia statica. Questo implica:
- Raccogliere stime di omografia su un periodo di tempo prestabilito.
- Rimuovere le stime anomale che differiscono significativamente dalla media.
- Mediare le stime rimanenti per creare una nuova omografia.
Generazione di Omografia Dinamica
Per cambiamenti a breve termine, viene utilizzato un metodo dinamico che aggiusta l'omografia in base alle stime vicine. Questo processo aiuta a tenere conto delle fluttuazioni rapide nella visibilità o nel posizionamento della telecamera.
I passaggi sono:
- Identificare le stime anomale di omografia.
- Calcolare una dimensione della finestra appropriata in base al numero di stime valide.
- Applicare una tecnica di smoothing per creare una nuova stima di omografia.
Metriche di Errore dell'Omarografia
Per valutare l'efficacia dei metodi di stima dell'omografia, vengono utilizzate varie metriche. Queste metriche confrontano le posizioni attese degli oggetti con le loro posizioni effettive, fornendo un'idea dell'accuratezza della stima.
Le metriche principali includono:
- Sub Drift: Misura la distanza tra i punti riscoperti e le loro posizioni etichettate originali.
- Full Drift: Confronta l'intero set di punti etichettati trasformati sia dall'omografia di riferimento che da quella stimata.
- Fitness: Valuta quanto bene l'omografia si allinea con la verità di base.
Queste metriche forniscono un quadro chiaro di quanto bene il sistema tracci le posizioni dei veicoli nel tempo.
Dettagli Sperimentali
Protocollo di Valutazione
Il tracker degli oggetti opera utilizzando un insieme specifico di dati di rilevamento. Per garantire accuratezza, le traiettorie GPS e le posizioni rilevate vengono confrontate a intervalli regolari.
La valutazione si concentra sul matching delle tracce degli oggetti con le posizioni GPS all'interno di un timeframe definito. Nei casi in cui il tracciamento non funziona, il sistema impiega metodi di interpolazione per colmare le lacune per l'analisi.
Impostazioni dei Parametri
Vari parametri vengono regolati per ottimizzare le performance degli algoritmi di tracciamento. Questi parametri includono impostazioni per filtri, generazione di omografie e addestramento del modello. Il fine-tuning assicura che il sistema operi in modo efficace.
Trattamento delle Informazioni Personali Identificabili
Nell'analizzare i dati dei veicoli, vengono adottati misure per proteggere la privacy delle persone. Il sistema segue un piano di gestione dei dati rigoroso per minimizzare il rischio di esposizione di informazioni personali identificabili (PII).
Le pratiche chiave includono:
- Rilasciare dati selezionati casualmente per ridurre la possibilità di identificare eventi specifici.
- Redigere automaticamente le informazioni sulle targa dai fotogrammi video.
- Revisionare manualmente e sfocare le aree che contengono proprietà private o persone visibili.
Queste misure garantiscono che, mentre i dati siano utili per la ricerca, la privacy degli individui sia comunque rispettata.
Artefatti e Anomalie Dati Conosciuti
Durante il processo di raccolta dei dati, alcuni problemi noti possono influenzare i risultati. Questi includono:
- Aree nella vista della telecamera che sono intenzionalmente oscurate per proteggere la privacy.
- Feed della telecamera mancanti a causa di guasti o danni all'attrezzatura.
- Cambiamenti nelle segnature stradali che influiscono sull'accuratezza dei punti di corrispondenza.
Essere consapevoli di queste anomalie è cruciale per interpretare i dati e migliorare le future iterazioni del sistema.
Conclusione
Il sistema descritto fornisce un quadro completo per tracciare i veicoli sull'Interstate 24 usando dati video e GPS. Impiegando vari sistemi di coordinate, metodi di omografia e etichettatura attenta dei dati, offre una soluzione innovativa per migliorare il monitoraggio dei trasporti.
La ricerca continua e i miglioramenti in questi metodi aumenteranno ulteriormente l'accuratezza e l'efficacia del tracciamento dei veicoli, contribuendo a strade più sicure e a una gestione del traffico più efficiente.
Titolo: So you think you can track?
Estratto: This work introduces a multi-camera tracking dataset consisting of 234 hours of video data recorded concurrently from 234 overlapping HD cameras covering a 4.2 mile stretch of 8-10 lane interstate highway near Nashville, TN. The video is recorded during a period of high traffic density with 500+ objects typically visible within the scene and typical object longevities of 3-15 minutes. GPS trajectories from 270 vehicle passes through the scene are manually corrected in the video data to provide a set of ground-truth trajectories for recall-oriented tracking metrics, and object detections are provided for each camera in the scene (159 million total before cross-camera fusion). Initial benchmarking of tracking-by-detection algorithms is performed against the GPS trajectories, and a best HOTA of only 9.5% is obtained (best recall 75.9% at IOU 0.1, 47.9 average IDs per ground truth object), indicating the benchmarked trackers do not perform sufficiently well at the long temporal and spatial durations required for traffic scene understanding.
Autori: Derek Gloudemans, Gergely Zachár, Yanbing Wang, Junyi Ji, Matt Nice, Matt Bunting, William Barbour, Jonathan Sprinkle, Benedetto Piccoli, Maria Laura Delle Monache, Alexandre Bayen, Benjamin Seibold, Daniel B. Work
Ultimo aggiornamento: 2023-09-13 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2309.07268
Fonte PDF: https://arxiv.org/pdf/2309.07268
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://media.icml.cc/Conferences/CVPR2023/cvpr2023-author_kit-v1_1-1.zip
- https://github.com/wacv-pcs/WACV-2023-Author-Kit
- https://github.com/MCG-NKU/CVPR_Template
- https://drive.google.com/drive/folders/1vOG8H31Rv0MjHml4Oi75RMvCj1mr_A_v?usp=sharing
- https://drive.google.com/file/d/1UUfhkMpG0hhWwjAqk8MDNc3lQ-gGRAZ0/view?usp=sharing