Migliorare la Sicurezza in Bici con la Tecnologia Panoramica
Nuovi metodi che usano telecamere panoramiche puntano a migliorare la sicurezza dei ciclisti sulle strade urbane.
― 10 leggere min
Indice
- Il ruolo della visione artificiale
- Creazione di un dataset
- Sfide nella ricerca sulla sicurezza ciclistica
- Metodologia per migliorare il rilevamento degli oggetti
- Risultati del miglioramento del rilevamento degli oggetti
- Miglioramento del tracciamento di più oggetti
- Applicazione per il rilevamento dei sorpassi
- Direzioni future
- Conclusione
- Fonte originale
- Link di riferimento
Andare in bici è un modo amichevole di viaggiare che non produce emissioni di carbonio e aiuta a ridurre il traffico, promuovendo anche la salute delle persone nelle città. Molte città nel mondo stanno incoraggiando l'uso della bici per diminuire l'uso dell'auto. Però, pedalare può sembrare rischioso, soprattutto in posti dove le piste ciclabili non sono ben sviluppate. Per esempio, a Londra, le piste ciclabili rappresentano solo una piccola frazione della lunghezza totale delle strade, costringendo i ciclisti a condividere la carreggiata con auto e altri veicoli. Le statistiche mostrano che, anche con un numero ridotto di ciclisti, ci sono molti incidenti che coinvolgono loro, portando a infortuni e vittime. Questo fa sì che la gente sia riluttante a usare la bici, riducendo così il numero complessivo di ciclisti per strada. Per incoraggiare l'uso della bici, le città devono migliorare le misure di sicurezza. Questo potrebbe significare infrastrutture migliori per le bici, limiti di velocità più bassi per le auto o campagne di sensibilizzazione sul comportamento sicuro degli automobilisti nei confronti dei ciclisti. Per fare tutto questo in modo efficace, chi decide deve avere prove solide su cosa funziona per mantenere i ciclisti al sicuro.
Anche se gli ospedali e i registri ufficiali del governo forniscono qualche informazione sugli incidenti in bici, spesso mancano di dettagli perché poche persone usano la bici. Dati più utili potrebbero arrivare da eventi di near-miss, dove i ciclisti rischiano di avere un incidente ma riescono a evitarlo. Questi near miss accadono più spesso, e i ricercatori hanno iniziato a usare diversi sensori per monitorarli, consentendoci di raccogliere più dati su cosa succede sulle strade.
Nuove tecnologie, come le telecamere panoramiche, stanno emergendo e possono registrare una vista a 360 gradi intorno a un ciclista. Questo è diverso dalle telecamere normali che possono catturare solo una piccola area. Le telecamere panoramiche possono essere attaccate alle bici o indossate sui caschi, fornendo una vista completa dell'ambiente. Questo permette ai ricercatori di vedere come i ciclisti interagiscono con le auto e altri utenti della strada, in particolare in situazioni come il Sorpasso, dove le auto passano accanto ai ciclisti.
Il ruolo della visione artificiale
L'ascesa del deep learning e del machine learning ha avuto un grande impatto su molte aree, compresa la visione artificiale, che si concentra su come i computer possano essere addestrati a riconoscere oggetti in immagini e video. Esistono molti algoritmi diversi per compiti come il rilevamento di oggetti e il loro Tracciamento nei frame di un video. Tuttavia, la maggior parte di questi algoritmi è stata progettata per immagini e video regolari, il che li rende meno efficaci sui video panoramici. Quando questi algoritmi vengono utilizzati direttamente su riprese panoramiche, spesso non funzionano bene a causa di varie distorsioni e differenze nel modo in cui gli oggetti appaiono in questo tipo di video.
Per affrontare questi problemi, si stanno facendo ricerche per adattare gli algoritmi esistenti alle sfide uniche presentate dai video panoramici. Ad esempio, quando si cercano oggetti in questi video, può essere utilizzata una tecnica speciale per suddividere l'immagine panoramica in segmenti più piccoli con meno distorsioni, consentendo un migliore Rilevamento degli oggetti. Questo è particolarmente utile per identificare i tanti piccoli oggetti di cui i ciclisti devono essere consapevoli sulla strada.
Una volta che gli oggetti vengono rilevati, è possibile tracciarli mentre si muovono nel video, il che è particolarmente importante per analizzare come veicoli e ciclisti interagiscono. Un modello ben noto chiamato DeepSort è spesso usato per tracciare oggetti. Tuttavia, quando applicato ai video panoramici, è necessario apportare modifiche per migliorarne l'accuratezza. Questo coinvolge il supporto di dettagli importanti come la continuità degli oggetti che potrebbero apparire ai bordi del video e il riconoscimento dei diversi tipi di oggetti in fase di tracciamento.
Creazione di un dataset
Per migliorare questi modelli di visione artificiale, è stato creato un dataset specifico per video di ciclismo panoramici. Questo ha comportato la raccolta di video registrati da ciclisti utilizzando un particolare tipo di telecamera che cattura viste panoramiche. Il processo è iniziato attaccando una telecamera a un casco o a una bici e registrando giri normali. L'obiettivo era raccogliere riprese autentiche senza controllare quando o dove avveniva la pedalata.
Una volta raccolti i video, è stato necessario tagliarli in clip specifiche per l'analisi. Sono state selezionate alcune clip brevi per addestrare e testare gli algoritmi utilizzati. Per garantire che i dati potessero essere utilizzati in modo efficace per migliorare i modelli, ogni video è stato accuratamente annotato, identificando vari oggetti come persone, bici, auto e altri veicoli visti nelle riprese. Questi dati annotati servono come verità fondamentale rispetto alla quale possono essere misurate le previsioni del modello.
Sfide nella ricerca sulla sicurezza ciclistica
I sistemi di trasporto urbano sono complessi, pieni di diversi tipi di utenti della strada che interagiscono tra loro. Questo crea numerosi rischi per i ciclisti, che condividono la strada con auto, camion e pedoni. Tradizionalmente, l'analisi di questi rischi si è basata fortemente su dati storici sugli incidenti. Tuttavia, tali dati possono essere limitati e non rappresentativi, soprattutto in aree con basse percentuali di ciclismo.
Alcuni ricercatori ora si stanno orientando verso studi naturalistici, consentendo loro di osservare i ciclisti nelle loro attività quotidiane. Questo comporta l'uso di sensori per raccogliere dati dettagliati durante le pedalate di routine. Questi dati possono catturare una varietà di fattori, fornendo una visione dell'esperienza di ciclismo.
Tuttavia, la maggior parte degli studi esistenti coinvolge telecamere che catturano solo una vista singola, davanti o dietro il ciclista. Queste prospettive singole possono trascurare rischi potenziali da altre direzioni. Utilizzando telecamere panoramiche, i ricercatori possono ottenere informazioni su come i ciclisti interagiscono con il loro ambiente completo. Questo consente una visione più completa dei rischi che affrontano.
Nonostante le potenzialità delle telecamere panoramiche, i modelli di visione artificiale esistenti faticano a lavorare con queste riprese. La mancanza di dati di addestramento sostanziali per video panoramici rappresenta una sfida, poiché molti dei modelli esistenti non sono stati progettati per le distorsioni create dalle proiezioni panoramiche. Questo porta a difficoltà nel rilevare piccoli oggetti o gestire la continuità quando gli oggetti si muovono ai bordi dei frame.
Metodologia per migliorare il rilevamento degli oggetti
Per affrontare le carenze dei modelli esistenti, è stata sviluppata una metodologia in tre fasi. Il primo passo ha coinvolto il miglioramento dei modelli di rilevamento degli oggetti esistenti in modo che potessero gestire meglio i video panoramici. Questo è stato fatto trasformando le immagini panoramiche in più sotto-immagini prospettiche, che subiscono meno distorsioni. Gli oggetti vengono quindi rilevati all'interno di queste immagini più piccole, consentendo migliori prestazioni.
Il secondo passo ha riguardato la modifica dell'algoritmo DeepSORT per gestire meglio i video panoramici. Questo comprendeva l'implementazione del supporto per la continuità e l'assicurazione che potesse correttamente identificare la categoria di ogni oggetto tracciato. Il rilevamento del primo passo ha servito da base per questo miglioramento.
Il passo finale ha comportato la creazione di un'applicazione che potesse rilevare automaticamente il comportamento di sorpasso nei veicoli circostanti in base ai risultati del processo di tracciamento. Questo aiuterebbe i ciclisti ad ottenere informazioni in tempo reale sui loro ambienti, puntando a migliorare la sicurezza.
Risultati del miglioramento del rilevamento degli oggetti
Dopo aver applicato i metodi proposti, si sono visti miglioramenti significativi nelle capacità di rilevamento degli oggetti. La valutazione dei modelli rispetto al dataset annotato ha indicato che sia YOLO v5 che Faster RCNN avevano migliorato le prestazioni di rilevamento a diverse risoluzioni. La metodologia ha ridotto il numero di falsi negativi e migliorato in modo significativo la precisione dei rilevamenti.
Le modifiche apportate, in particolare l'unione delle bounding box per oggetti lunghi che erano stati divisi durante la trasformazione prospettica, si sono rivelate cruciali. Questi cambiamenti hanno dimostrato un aumento notevole delle prestazioni per oggetti piccoli e medi, che sono fondamentali per valutare il rischio negli ambienti ciclistici, poiché rappresentano la maggior parte degli oggetti incontrati sulla strada.
Miglioramento del tracciamento di più oggetti
Il secondo passo nella metodologia si è concentrato sul miglioramento del tracciamento degli oggetti mentre si muovono attraverso i frame video utilizzando il DeepSORT modificato. I miglioramenti apportati al processo di tracciamento includevano il supporto per le informazioni sulle categorie e l'implementazione della continuità durante l'intero processo di tracciamento.
Introdurre un attributo di categoria nel modello DeepSORT ha migliorato significativamente l'accuratezza del matching degli oggetti. Questo ha aiutato a evitare di confondere diversi tipi di oggetti, come persone e veicoli. Inoltre, sono state aggiunte funzionalità per gestire oggetti che si muovono attraverso i confini delle sotto-immagini, che è stata una sfida chiave nei tentativi precedenti di tracciamento nei video panoramici.
I risultati hanno mostrato che i miglioramenti hanno portato a una performance di tracciamento più stabile e hanno ridotto il numero di ID cambiati durante il tracciamento. Questo significa che gli oggetti sono stati tracciati in modo più coerente, permettendo una visione più chiara di come gli utenti della strada interagiscono tra loro.
Applicazione per il rilevamento dei sorpassi
Nell'ultimo passo della metodologia, è stata progettata un'applicazione per rilevare automaticamente il comportamento di sorpasso nei veicoli che circondano i ciclisti. Analizzando i dati di tracciamento, l'applicazione classifica il movimento di ciascun veicolo in base alla sua direzione e posizione rispetto al ciclista.
L'applicazione sfrutta i dati continui dal processo di tracciamento per identificare quando un veicolo inizia a sorpassare un ciclista. Quando l'applicazione rileva un tentativo di sorpasso, classifica l'evento come confermato o in corso.
Per aumentare la consapevolezza del ciclista sui potenziali rischi, l'applicazione può emettere avvisi quando viene rilevato un veicolo in fase di sorpasso. Questa capacità di fornire feedback in tempo reale potrebbe aiutare i ciclisti a rispondere rapidamente alle condizioni che cambiano attorno a loro, migliorando la sicurezza complessiva sulla strada.
Direzioni future
Anche se i metodi sviluppati hanno mostrato promesse, c'è ancora margine di miglioramento. Una limitazione riguarda il rilevamento di oggetti grandi che potrebbero essere divisi in più sotto-immagini. Aumentare il numero di proiezioni prospettiche potrebbe fornire una copertura migliore e migliorare i tassi di rilevamento per questi oggetti.
Inoltre, l'attuale velocità di inferenza dei modelli potrebbe essere ulteriormente ottimizzata. Esplorare tecniche di multi-processing consentirà calcoli più rapidi e potrebbe portare a capacità in tempo reale per l'applicazione.
Un'altra strada per future ricerche include l'utilizzo di algoritmi di tracciamento più avanzati per tenere conto di movimenti e interazioni più complessi che potrebbero verificarsi, specialmente in ambienti urbani affollati. Raccogliere ulteriori dati e costruire su dataset esistenti contribuirà anche a modelli più robusti per l'analisi della sicurezza ciclistica.
Conclusione
L'uso di telecamere panoramiche combinato con tecniche avanzate di visione artificiale ha un grande potenziale per migliorare la sicurezza ciclistica. Applicando questi metodi, diventa possibile identificare le interazioni e le situazioni rischiose che i ciclisti affrontano negli ambienti urbani.
I risultati mostrano che migliorare i modelli di rilevamento e tracciamento degli oggetti può portare a una migliore comprensione e mitigazione dei rischi associati al ciclismo. Un ulteriore lavoro in questo campo promette di fornire ai ciclisti strumenti preziosi che li aiutano a navigare i loro ambienti in modo più sicuro. Con ulteriori ricerche e sviluppi, c'è una forte opportunità di trasformare l'approccio alla sicurezza ciclistica, incoraggiando infine più persone a salire in sella.
Titolo: Multiple Object Detection and Tracking in Panoramic Videos for Cycling Safety Analysis
Estratto: Panoramic cycling videos can record 360{\deg} views around the cyclists. Thus, it is essential to conduct automatic road user analysis on them using computer vision models to provide data for studies on cycling safety. However, the features of panoramic data such as severe distortions, large number of small objects and boundary continuity have brought great challenges to the existing CV models, including poor performance and evaluation methods that are no longer applicable. In addition, due to the lack of data with annotations, it is not easy to re-train the models. In response to these problems, the project proposed and implemented a three-step methodology: (1) improve the prediction performance of the pre-trained object detection models on panoramic data by projecting the original image into 4 perspective sub-images; (2) introduce supports for boundary continuity and category information into DeepSORT, a commonly used multiple object tracking model, and set an improved detection model as its detector; (3) using the tracking results, develop an application for detecting the overtaking behaviour of the surrounding vehicles. Evaluated on the panoramic cycling dataset built by the project, the proposed methodology improves the average precision of YOLO v5m6 and Faster RCNN-FPN under any input resolution setting. In addition, it raises MOTA and IDF1 of DeepSORT by 7.6\% and 9.7\% respectively. When detecting the overtakes in the test videos, it achieves the F-score of 0.88. The code is available on GitHub at github.com/cuppp1998/360_object_tracking to ensure the reproducibility and further improvements of results.
Autori: Jingwei Guo, Meihui Wang, Ilya Ilyankou, Natchapon Jongwiriyanurak, Xiaowei Gao, Nicola Christie, James Haworth
Ultimo aggiornamento: 2024-07-21 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2407.15199
Fonte PDF: https://arxiv.org/pdf/2407.15199
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.