Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

CycleCrash : Un Nouveau Jeu de Données pour la Sécurité des Cyclistes

Le dataset CycleCrash vise à améliorer la sécurité des cyclistes grâce à l'analyse vidéo.

― 11 min lire


Révolution des données deRévolution des données desécurité à vélocyclistes.compréhension des risques pour lesNouveau jeu de données améliore la
Table des matières

Le cyclisme devient de plus en plus populaire pour se déplacer dans les villes. C’est super pour rester en forme et aider l’environnement, mais faire du vélo comporte des risques. Malheureusement, chaque année, beaucoup de cyclistes se blessent, et le nombre d'accidents mortels a augmenté de manière significative. La plupart des recherches sur les voitures autonomes ne se concentrent pas vraiment sur les cyclistes, ce qui ajoute au danger. Pour changer ça, un nouveau dataset appelé CycleCrash a été créé. Ce dataset comprend 3 000 vidéos d'incidents liés aux vélos, allant des accidents aux interactions sûres avec les voitures. L’objectif est d’améliorer la sécurité des cyclistes en développant de meilleures technologies pouvant prédire et analyser les collisions.

Le Besoin de Données

Des études montrent que plus de 130 000 cyclistes sont blessés dans des accidents chaque année. Les accidents mortels impliquant des cyclistes ont augmenté de plus de 50 % au cours de la dernière décennie. Bien que l'apprentissage automatique ait aidé à améliorer la technologie des voitures autonomes, il manque des données spécifiques liées à la sécurité des cyclistes. Les datasets existants incluent souvent des vélos mais ne fournissent pas les informations nécessaires pour traiter les problèmes auxquels les cyclistes sont confrontés sur la route.

Certains datasets utilisés pour les véhicules autonomes incluent des données liées aux vélos. Cependant, le nombre d'instances impliquant des cyclistes est assez faible. Par exemple, un dataset populaire n’a un peu plus de 1 000 images avec des cyclistes. Cette représentation limitée ne fournit pas assez d’informations pour développer des solutions de sécurité ciblées pour les cyclistes.

Les datasets actuels échouent également à offrir des Annotations complètes nécessaires pour une analyse détaillée. Par exemple, ils n'indiquent pas toujours à quel point le comportement d'un cycliste est risqué ou à quel point un accident potentiel pourrait être grave. Ce manque d'information complique la création de mesures de sécurité efficaces pour les cyclistes.

Présentation de CycleCrash

Pour résoudre ces problèmes, CycleCrash propose une solution en mettant en avant une grande collection de vidéos axées sur les cyclistes dans différentes situations. Le dataset comprend 3 000 vidéos, ce qui en fait l'une des collections les plus étendues pour cet objectif. Ces vidéos capturent une variété d’interactions que les cyclistes ont avec d'autres véhicules et piétons.

Le dataset contient 13 types d'informations (ou annotations) organisées en trois groupes principaux : facteurs liés aux collisions, facteurs liés aux cyclistes et facteurs liés à la scène. Cette approche structurée permet aux chercheurs de mieux comprendre les défis auxquels font face les cyclistes sur la route. De plus, CycleCrash permet neuf tâches spécifiques liées à la prédiction des collisions et à la sécurité des cyclistes, faisant de lui une ressource vitale pour le développement de nouvelles technologies de sécurité.

Processus de Collecte des Données

CycleCrash rassemble des vidéos provenant de diverses plateformes en ligne comme YouTube et Facebook, en se concentrant sur des clips impliquant des cyclistes. Les critères de sélection pour inclure les vidéos sont spécifiques :

  1. Vidéos montrant une collision ou un quasi-accident entre un cycliste et un véhicule à moteur.
  2. Vidéos montrant un cycliste percutant un autre cycliste ou un piéton.
  3. Vidéos où un cycliste tombe à cause d'obstacles comme des nids-de-poule ou des problèmes mécaniques.
  4. Clips démontrant des comportements risqués de la part des cyclistes, mettant en évidence des risques potentiels de collision.
  5. Vidéos montrant des cyclistes naviguant en toute sécurité dans le trafic urbain sans comportements risqués.

Au total, le dataset contient 2 000 vidéos sans accident et 1 000 montrant différents niveaux d'accidents potentiels. L'utilisation de vidéos de dashcam provenant de véhicules offre une vue plus réaliste des conditions de cyclisme par rapport aux caméras fixes comme les CCTV.

Structure du Dataset

Le dataset CycleCrash est organisé sous forme d'une liste de liens vidéo, avec des heures de début et de fin spécifiques pour des événements importants dans ces vidéos. Les vidéos proviennent de publications publiques pour ne pas empiéter sur la vie privée de qui que ce soit. Le dataset comprend également un outil qui aide les utilisateurs à télécharger et traiter ces vidéos de manière cohérente.

Les vidéos subissent plusieurs étapes de traitement :

  1. Rognage Temporel : Chaque vidéo est coupée pour ne se concentrer que sur les clips pertinents.
  2. Conversion de Fichier : Toutes les vidéos sont converties dans un format uniforme.
  3. Rognage et Redimensionnement Spatial : Les vidéos sont redimensionnées à une résolution standard.
  4. Ajustement de la Fréquence d'Image : Les vidéos sont ajustées pour garantir qu'elles se jouent à une vitesse cohérente.
  5. Normalisation des Couleurs : Les vidéos passent par un processus visant à standardiser les aspects colorés.

Les détails complets dans le dataset permettent une variété de tâches liées à la sécurité des cyclistes.

Annotations

Les annotations dans CycleCrash aident à classifier et décrire ce qui se passe dans chaque vidéo. Elles se divisent en trois catégories :

Annotations Liées aux Collisions

Ces annotations se réfèrent à des éléments spécifiquement liés aux accidents ou aux quasi-accidents. Elles incluent :

  • Droit de Passage : Indique quel partie avait la priorité dans l'interaction.
  • Temps jusqu'à la Collision : Mesure le temps restant avant qu'une collision potentielle se produise.
  • Type d'objet impliqué : Identifie quel véhicule ou objet interagit avec le cycliste.
  • Responsabilité : Établit qui est à blâmer en cas de collision.
  • Sévérité : Évalue à quel point la blessure ou la collision potentielle pourrait être grave.

Annotations Liées aux Cyclistes

Celles-ci fournissent des détails sur le cycliste dans la vidéo :

  • Indice de Risque de Comportement du Cycliste : Mesure à quel point les actions d'un cycliste sont risquées.
  • Âge du Cycliste : Estime l'âge du cycliste en fonction de son apparence.
  • Type de Cycliste : Différencie entre cyclistes compétitifs et récréatifs.
  • Boîte Englobante du Cycliste : Marque la zone où se trouve le cycliste.
  • Direction du Cycliste : Indique où se dirige le cycliste.

Annotations Liées à la Scène

Celles-ci détaillent les informations relatives à l'environnement et aux autres véhicules :

  • Direction de l'objet impliqué : Montre de quel côté le véhicule se déplace.
  • Position de la caméra : Capture l’angle à partir duquel la vidéo a été filmée.
  • Véhicule Ego impliqué : Identifie le véhicule portant la dashcam.

Cet ensemble structuré d'annotations facilite l'évaluation des différents facteurs impliqués dans la sécurité des cyclistes.

Contrôle de Qualité

Pour garantir la qualité du dataset, les vidéos ont été sélectionnées en utilisant des termes de recherche spécifiques liés aux accidents de vélo et aux collisions. Des vérifications automatiques ont assuré que les vidéos respectaient les exigences minimales de fréquence d'images et de résolution. Par la suite, des inspecteurs humains ont examiné les vidéos pour confirmer qu'elles correspondaient aux critères de sélection.

Les annotateurs qui ont annoté les vidéos ont été formés pour suivre des directives détaillées, en prêtant une attention particulière aux règles de circulation et au comportement des cyclistes. Cette approche minutieuse visait à minimiser les biais et à garantir un étiquetage précis, renforçant la fiabilité globale du dataset.

Tâches et Métriques

CycleCrash définit neuf tâches critiques basées sur les données collectées. Voici un résumé :

  1. Prédiction de l'Indice de Risque de Comportement du Cycliste : Estimation du niveau de risque du comportement d'un cycliste et catégorisation en classes comme faible ou élevé risque.
  2. Classification du Droit de Passage : Détermination si le cycliste avait le droit de passage dans une interaction.
  3. Anticipation de Collision du Cycliste : Prédiction si un événement se traduira par une collision dans un délai fixé.
  4. Prédiction du Temps jusqu'à la Collision : Estimation du moment exact où une collision se produira.
  5. Classification de la Sévérité : Classification de la sévérité d'un accident potentiel en catégories comme sûr ou à fort impact.
  6. Classification de la Responsabilité : Détermination de qui était en faute dans un accident.
  7. Classification de l'Âge du Cycliste : Classification de l'âge du cycliste en groupes comme jeune, adulte ou vieux.
  8. Détection de la Direction du Cycliste : Identification de la direction vers laquelle se déplace le cycliste.
  9. Détection de la Direction de l'Objet Impliqué : Identification de la direction des autres véhicules interagissant avec le cycliste.

Ces tâches sont axées sur l'amélioration de la sécurité et la compréhension de la manière dont les cyclistes interagissent avec leur environnement.

Méthode VidNeXt

Pour analyser les données efficacement, une nouvelle méthode appelée VidNeXt a été proposée. Cette approche utilise des techniques modernes d'apprentissage profond pour améliorer l’analyse vidéo. VidNeXt combine un extracteur de caractéristiques et un transformateur pour mieux capturer le flux d'informations au fil du temps.

L'architecture implique :

  • ConvNeXt : Un composant qui traite les images vidéo pour extraire des caractéristiques visuelles.
  • Blocs de Transformateur : Ceux-ci aident à comprendre comment les images se rapportent les unes aux autres au fil du temps. Une attention particulière est portée à la fois sur les éléments stationnaires et non stationnaires, permettant une meilleure interprétation des scènes dynamiques.

Cette méthode vise à apprendre les complexités des données vidéo plus efficacement, améliorant l'exactitude des prédictions dans les tâches définies dans le dataset CycleCrash.

Expérimentations et Résultats

L'équipe a réalisé des expériences en utilisant le dataset CycleCrash pour évaluer l’efficacité de VidNeXt par rapport aux modèles existants. Les vidéos ont été divisées en ensembles d’entraînement et de test, garantissant des comparaisons équitables.

Des modèles largement utilisés dans la communauté ont été inclus comme références. Ces modèles ont montré des promesses dans diverses tâches liées à l'analyse vidéo. De plus, deux variations de VidNeXt ont été testées pour isoler l'impact de ses composants séparément.

Les résultats ont montré que VidNeXt surpassait la plupart des autres modèles dans diverses tâches. Notamment, il a excellé dans la prédiction du risque de comportement des cyclistes, la classification du droit de passage et l'anticipation des collisions. Les résultats ont mis en évidence l'efficacité de VidNeXt dans le traitement des données vidéo, prouvant qu'il fournit de meilleures informations sur la sécurité des cyclistes que les méthodes précédentes.

Évaluation Croisée des Datasets

Pour tester à quel point les modèles fonctionnent sur des données provenant de différentes sources, une évaluation croisée des datasets a été réalisée. Cela a impliqué un entraînement sur CycleCrash et un test sur d'autres datasets comme CCD et DoTA, qui concernent principalement des collisions de voitures. Les résultats ont montré qu'un entraînement sur CycleCrash entraînait de meilleures performances lors d’un test sur d'autres datasets par rapport à l'approche inverse. Cela indique que CycleCrash fournit des informations uniques et précieuses que d'autres datasets n'ont pas.

Conclusion

CycleCrash est un dataset révolutionnaire qui vise à améliorer la sécurité des cyclistes grâce à une meilleure compréhension et prédiction des risques de collision. En présentant une large gamme de vidéos et des annotations détaillées, CycleCrash sert de ressource vitale pour les chercheurs développant des technologies axées sur la sécurité des cyclistes. La méthode proposée, VidNeXt, montre des résultats prometteurs dans l'analyse efficace de ces vidéos, ouvrant la voie à de futures avancées dans la protection des cyclistes.

Avec l'augmentation du cyclisme dans les zones urbaines, il est crucial de continuer à améliorer les technologies qui peuvent prédire et atténuer les risques pour les cyclistes. Le travail réalisé avec CycleCrash souligne non seulement le besoin de plus de données dans ce domaine, mais pose également les bases de recherches futures visant à rendre le cyclisme plus sûr pour tous.

Source originale

Titre: CycleCrash: A Dataset of Bicycle Collision Videos for Collision Prediction and Analysis

Résumé: Self-driving research often underrepresents cyclist collisions and safety. To address this, we present CycleCrash, a novel dataset consisting of 3,000 dashcam videos with 436,347 frames that capture cyclists in a range of critical situations, from collisions to safe interactions. This dataset enables 9 different cyclist collision prediction and classification tasks focusing on potentially hazardous conditions for cyclists and is annotated with collision-related, cyclist-related, and scene-related labels. Next, we propose VidNeXt, a novel method that leverages a ConvNeXt spatial encoder and a non-stationary transformer to capture the temporal dynamics of videos for the tasks defined in our dataset. To demonstrate the effectiveness of our method and create additional baselines on CycleCrash, we apply and compare 7 models along with a detailed ablation. We release the dataset and code at https://github.com/DeSinister/CycleCrash/ .

Auteurs: Nishq Poorav Desai, Ali Etemad, Michael Greenspan

Dernière mise à jour: Oct 30, 2024

Langue: English

Source URL: https://arxiv.org/abs/2409.19942

Source PDF: https://arxiv.org/pdf/2409.19942

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires