CycleCrash: Un Nuovo Dataset per la Sicurezza dei Ciclisti
Il dataset CycleCrash punta a migliorare la sicurezza dei ciclisti attraverso l'analisi video.
― 9 leggere min
Indice
- La Necessità di Dati
- Introduzione di CycleCrash
- Processo di Raccolta Dati
- Struttura del Dataset
- Annotazioni
- Annotazioni Legate alle Collisioni
- Annotazioni Legate ai Ciclisti
- Annotazioni Legate alla Scena
- Controllo della Qualità
- Compiti e Metriche
- Metodo VidNeXt
- Esperimenti e Risultati
- Valutazione Cross-Dataset
- Conclusione
- Fonte originale
- Link di riferimento
Il ciclismo sta diventando sempre più popolare come modo per muoversi nelle città. È un ottimo modo per rimanere in forma e aiutare l'ambiente, ma andare in bici comporta dei rischi. Purtroppo, molti ciclisti si feriscono ogni anno, e il numero di incidenti mortali è aumentato notevolmente. La maggior parte delle ricerche sulle auto a guida autonoma non si concentra molto sui ciclisti, il che aumenta il pericolo. Per cambiare questa situazione, è stato creato un nuovo dataset chiamato CycleCrash. Questo dataset include 3.000 video di incidenti legati alle biciclette, coprendo tutto, dagli incidenti alle interazioni sicure con le auto. L'obiettivo è migliorare la sicurezza per i ciclisti sviluppando tecnologie migliori che possano prevedere e analizzare le collisioni.
La Necessità di Dati
Studi mostrano che più di 130.000 ciclisti si feriscono in incidenti ogni anno. Gli incidenti mortali che coinvolgono ciclisti sono aumentati di oltre il 50% nell'ultimo decennio. Anche se l'apprendimento automatico ha aiutato a migliorare la tecnologia delle auto a guida autonoma, c'è una mancanza di dati specifici riguardanti la sicurezza dei ciclisti. I dataset esistenti spesso includono biciclette ma non forniscono le informazioni necessarie per affrontare i problemi che i ciclisti affrontano sulla strada.
Alcuni dataset usati per i veicoli a guida autonoma includono dati legati alle biciclette. Tuttavia, il numero di casi che coinvolgono ciclisti è piuttosto ridotto. Per esempio, un dataset popolare ha solo poco più di 1.000 fotogrammi con ciclisti. Questa rappresentazione limitata non fornisce abbastanza informazioni per sviluppare soluzioni di sicurezza mirate per i ciclisti.
I dataset attuali non offrono nemmeno annotazioni complete necessarie per un'analisi dettagliata. Ad esempio, non indicano sempre quanto sia rischioso il comportamento di un ciclista o quanto grave potrebbe essere un potenziale incidente. Questa mancanza di informazioni rende difficile creare misure di sicurezza efficaci per i ciclisti.
Introduzione di CycleCrash
Per affrontare questi problemi, CycleCrash offre una soluzione presentando una grande collezione di video incentrati sui ciclisti in varie situazioni. Il dataset include 3.000 video, rendendolo una delle collezioni più ampie a questo scopo. Questi video catturano una varietà di interazioni che i ciclisti hanno con altri veicoli e pedoni.
Il dataset contiene 13 tipi di informazioni (o annotazioni) organizzate in tre gruppi principali: fattori legati alle collisioni, fattori legati ai ciclisti e fattori legati alla scena. Questo approccio strutturato permette ai ricercatori di comprendere meglio le sfide che i ciclisti affrontano sulla strada. Inoltre, CycleCrash consente nove compiti specifici legati alla previsione delle collisioni e alla sicurezza dei ciclisti, rendendolo una risorsa fondamentale per sviluppare nuove tecnologie di sicurezza.
Processo di Raccolta Dati
CycleCrash raccoglie video da varie piattaforme online come YouTube e Facebook, concentrandosi su clip che coinvolgono ciclisti. I criteri di selezione per includere i video sono specifici:
- Video che mostrano una collisione o quasi-collisione tra un ciclista e un veicolo a motore.
- Video che mostrano un ciclista che collide con un altro ciclista o un pedone.
- Video in cui un ciclista cade a causa di ostacoli come buche o problemi meccanici.
- Clip che dimostrano comportamenti rischiosi da parte dei ciclisti, evidenziando potenziali rischi di collisione.
- Video che mostrano ciclisti che navigano in sicurezza nel traffico urbano senza comportamenti rischiosi.
In totale, il dataset contiene 2.000 video privi di incidenti e 1.000 che mostrano diversi livelli di potenziali incidenti. L'uso di video da telecamere da cruscotto offre una visione più realistica delle condizioni di ciclismo rispetto a telecamere fisse come le CCTV.
Struttura del Dataset
Il dataset CycleCrash è organizzato come un elenco di collegamenti a video, insieme a orari di inizio e fine specifici per eventi importanti all'interno di quei video. I video provengono da post pubblici per garantire che non violino la privacy di nessuno. Il dataset include anche un toolkit che aiuta gli utenti a scaricare e elaborare questi video in modo coerente.
I video subiscono diversi passaggi di elaborazione:
- Taglio Temporale: Ogni video viene ritagliato per concentrarsi solo sui clip rilevanti.
- Conversione File: Tutti i video vengono convertiti in un formato uniforme.
- Ritaglio e Ridimensionamento Spaziale: I video vengono ridimensionati a una risoluzione standard.
- Regolazione della Velocità di Riproduzione: I video vengono regolati per garantire che vengano riprodotti a una velocità costante.
- Normalizzazione del Colore: I video subiscono un processo per standardizzare gli aspetti cromatici.
I dettagli completi nel dataset consentono di svolgere vari compiti legati alla sicurezza dei ciclisti.
Annotazioni
Le annotazioni in CycleCrash aiutano a classificare e descrivere cosa accade in ogni video. Esse rientrano in tre categorie:
Annotazioni Legate alle Collisioni
Queste annotazioni si riferiscono a elementi legati specificamente a incidenti o quasi-collisioni. Includono:
- Diritto di precedenza: Indica quale parte aveva la priorità nell'interazione.
- Tempo fino alla collisione: Misura il tempo che manca prima che possa verificarsi una collisione.
- Tipo di oggetto coinvolto: Identifica quale veicolo o oggetto sta interagendo con il ciclista.
- Colpa: Stabilisce chi è da ritenere responsabile in caso di collisione.
- Severità: Valuta quanto grave potrebbe essere la lesione o la potenziale collisione.
Annotazioni Legate ai Ciclisti
Queste forniscono dettagli sul ciclista nel video:
- Indice di rischio del comportamento del ciclista: Misura quanto siano rischiose le azioni di un ciclista.
- Età del ciclista: Stima l'età del ciclista in base all'aspetto.
- Tipo di ciclista: Differenzia tra ciclisti competitivi e ricreativi.
- Rettangolo di delimitazione del ciclista: Segna l'area in cui si trova il ciclista.
- Direzione del ciclista: Indica dove si sta dirigendo il ciclista.
Annotazioni Legate alla Scena
Queste dettagli informazioni relative all'ambiente e ad altri veicoli:
- Direzione dell'oggetto coinvolto: Mostra in quale direzione si sta muovendo il veicolo.
- Posizione della telecamera: Cattura l'angolo da cui è stato filmato il video.
- Veicolo ego coinvolto: Identifica il veicolo con la dashcam.
Questo set strutturato di annotazioni rende più facile valutare vari fattori coinvolti nella sicurezza dei ciclisti.
Controllo della Qualità
Per garantire la qualità del dataset, i video sono stati selezionati utilizzando termini di ricerca specifici relativi agli incidenti e alle collisioni tra biciclette. Controlli automatici hanno garantito che i video soddisfacessero i requisiti minimi di frame rate e risoluzione. Successivamente, ispettori umani hanno esaminato i video per confermare che rispettassero i criteri di selezione.
Gli etichettatori che hanno annotato i video sono stati formati per seguire linee guida dettagliate, prestando particolare attenzione alle norme del traffico e al comportamento dei ciclisti. Questo approccio accurato mirava a ridurre al minimo il bias e garantire un'etichettatura accurata, migliorando l'affidabilità complessiva del dataset.
Compiti e Metriche
CycleCrash definisce nove compiti cruciali basati sui dati raccolti. Ecco un riepilogo:
- Previsione dell'Indice di Rischio del Comportamento del Ciclista: Stimare il livello di rischio del comportamento di un ciclista e classificarlo in categorie come basso o alto rischio.
- Classificazione del Diritto di Precedenza: Determinare se il ciclista aveva il diritto di precedenza in un'interazione.
- Anticipazione delle Collisioni dei Ciclisti: Prevedere se un evento porterà a una collisione entro un lasso di tempo stabilito.
- Previsione del Tempo fino alla Collisione: Stimare il momento esatto in cui avverrà una collisione.
- Classificazione della Severità: Classificare la severità di un potenziale incidente in categorie come sicuro o di alto impatto.
- Classificazione della Colpa: Determinare chi è stato responsabile in un incidente.
- Classificazione dell'Età del Ciclista: Classificare l'età del ciclista in gruppi come giovane, adulto o anziano.
- Rilevazione della Direzione del Ciclista: Identificare la direzione in cui si sta muovendo il ciclista.
- Rilevazione della Direzione dell'Oggetto Coinvolto: Identificare la direzione degli altri veicoli che interagiscono con il ciclista.
Questi compiti sono focalizzati sul miglioramento della sicurezza e sulla comprensione di come i ciclisti interagiscono con il loro ambiente.
Metodo VidNeXt
Per analizzare i dati in modo efficace, è stato proposto un nuovo metodo chiamato VidNeXt. Questo approccio utilizza tecniche moderne di deep learning per migliorare l'analisi dei video. VidNeXt combina un estrattore di funzionalità e un trasformatore per catturare meglio il flusso di informazioni nel tempo.
L'architettura coinvolge:
- ConvNeXt: Un componente che elabora i fotogrammi video per estrarre caratteristiche visive.
- Blocchi di Trasformatore: Questi aiutano a comprendere come i fotogrammi si relazionano tra loro nel tempo. Un'attenzione speciale è data sia agli elementi stazionari che a quelli non stazionari, consentendo una migliore interpretazione di scene dinamiche.
Questo metodo mira a imparare le complessità dei dati video in modo più efficiente, migliorando l'accuratezza delle previsioni nei compiti definiti all'interno del dataset CycleCrash.
Esperimenti e Risultati
Il team ha condotto esperimenti utilizzando il dataset CycleCrash per valutare l'efficacia di VidNeXt rispetto ai modelli esistenti. I video sono stati suddivisi in set di addestramento e test, garantendo confronti equi.
Modelli ampiamente utilizzati nella comunità sono stati inclusi come baseline. Questi modelli hanno già mostrato risultati promettenti in vari compiti legati all'analisi video. Inoltre, sono state testate due variazioni di VidNeXt per isolare l'impatto dei suoi componenti separatamente.
I risultati hanno dimostrato che VidNeXt ha superato la maggior parte degli altri modelli in vari compiti. In particolare, ha eccelso nella previsione del rischio comportamentale dei ciclisti, nella classificazione del diritto di precedenza e nell'anticipazione delle collisioni. I risultati hanno messo in evidenza l'efficacia di VidNeXt nell'elaborare dati video, dimostrando che fornisce migliori intuizioni sulla sicurezza dei ciclisti rispetto ai metodi precedenti.
Valutazione Cross-Dataset
Per testare quanto bene i modelli si comportano su dati provenienti da fonti diverse, è stata condotta una valutazione cross-dataset. Questo ha coinvolto l'addestramento su CycleCrash e il test su altri dataset come CCD e DoTA, che riguardano principalmente collisioni tra auto. I risultati hanno mostrato che l'addestramento su CycleCrash ha portato a una migliore performance quando testato su altri dataset rispetto all'approccio opposto. Ciò indica che CycleCrash fornisce informazioni uniche e preziose che altri dataset non hanno.
Conclusione
CycleCrash è un dataset innovativo che mira a migliorare la sicurezza dei ciclisti attraverso una migliore comprensione e previsione dei rischi di collisione. Presentando una vasta gamma di video e annotazioni dettagliate, CycleCrash funge da risorsa vitale per i ricercatori che sviluppano tecnologie focalizzate sulla sicurezza dei ciclisti. Il metodo proposto, VidNeXt, mostra risultati promettenti nell'analisi di questi video in modo efficace, aprendo la strada a futuri progressi nella protezione dei ciclisti.
Con l'aumento del ciclismo nelle aree urbane, è fondamentale continuare a migliorare le tecnologie che possono prevedere e mitigare i rischi per i ciclisti. Il lavoro svolto con CycleCrash non solo evidenzia la necessità di più dati in questo settore, ma prepara anche il terreno per ulteriori ricerche volte a rendere il ciclismo più sicuro per tutti.
Titolo: CycleCrash: A Dataset of Bicycle Collision Videos for Collision Prediction and Analysis
Estratto: Self-driving research often underrepresents cyclist collisions and safety. To address this, we present CycleCrash, a novel dataset consisting of 3,000 dashcam videos with 436,347 frames that capture cyclists in a range of critical situations, from collisions to safe interactions. This dataset enables 9 different cyclist collision prediction and classification tasks focusing on potentially hazardous conditions for cyclists and is annotated with collision-related, cyclist-related, and scene-related labels. Next, we propose VidNeXt, a novel method that leverages a ConvNeXt spatial encoder and a non-stationary transformer to capture the temporal dynamics of videos for the tasks defined in our dataset. To demonstrate the effectiveness of our method and create additional baselines on CycleCrash, we apply and compare 7 models along with a detailed ablation. We release the dataset and code at https://github.com/DeSinister/CycleCrash/ .
Autori: Nishq Poorav Desai, Ali Etemad, Michael Greenspan
Ultimo aggiornamento: Oct 30, 2024
Lingua: English
URL di origine: https://arxiv.org/abs/2409.19942
Fonte PDF: https://arxiv.org/pdf/2409.19942
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.