Utiliser la technologie audio pour le suivi des piétons
Cette étude examine les méthodes audio pour suivre les mouvements des piétons dans les zones urbaines.
― 9 min lire
Table des matières
- Introduction à la détection des Piétons
- L'importance des technologies des villes intelligentes
- Méthodes actuelles de détection des piétons
- Aperçu du jeu de données ASPED
- Méthodologie pour la détection des piétons
- Expérimentations avec l'entrée audio
- Prédiction des flux de piétons
- Résultats des expériences
- Directions futures pour la technologie de détection audio
- Conclusion
- Source originale
- Liens de référence
Ce travail est le résultat d'une contribution égale de tous les auteurs impliqués.
Introduction à la détection des Piétons
Les villes utilisent souvent divers Capteurs pour suivre le mouvement des véhicules, mais le suivi des piétons est moins courant. Pourtant, beaucoup de gens marchent dans les villes, surtout en Europe, en Afrique et en Asie. Savoir combien de personnes marcher et où elles vont est important pour rendre les villes plus sûres et accueillantes pour les piétons. Cette étude examine une nouvelle façon de surveiller le mouvement des piétons en utilisant la technologie Audio. On compare les capteurs basés sur des microphones avec d'autres méthodes de détection des piétons et on présente un ensemble de données appelé ASPED, qui comprend des enregistrements audio et Vidéo pour aider à compter les piétons. On discute de la façon dont ces données audio peuvent aider à prédire où les piétons vont et on réfléchit à comment cela peut bénéficier à la planification urbaine.
L'importance des technologies des villes intelligentes
Les projets de ville intelligente s'appuient souvent sur des capteurs pour superviser les différents services de la ville. En analysant comment ces services sont utilisés, les villes peuvent identifier des problèmes et déterminer comment mieux allouer les ressources. Comprendre quand et où les services sont nécessaires aide à garantir qu'ils soient fournis de manière équitable et durable. De nos jours, les villes utilisent principalement des capteurs dans le domaine des transports, mais aussi pour suivre les conditions environnementales et la sécurité publique. Récemment, un intérêt croissant pour les technologies qui aident à surveiller comment les gens se déplacent a émergé.
Traditionnellement, le mouvement des véhicules a été la priorité de la planification du trafic, tandis que le mouvement des piétons n'a pas reçu la même attention. En surveillant les flux de piétons, les urbanistes peuvent créer de meilleurs environnements accessibles à pied et obtenir des informations sur les espaces publics que les gens aiment fréquenter ou éviter. Prédire avec précision comment les gens se comportent dans les espaces publics est essentiel pour une planification urbaine efficace.
Méthodes actuelles de détection des piétons
La plupart des détections de piétons reposent actuellement sur l'analyse vidéo ou les compteurs infrarouges, qui peuvent être coûteux. D'autres technologies comme le radar et les capteurs piézoélectriques sont également chers et compliqués à entretenir. Cette étude explore le potentiel de l'utilisation de microphones pour détecter les piétons. Les microphones sont relativement bon marché, consomment peu d'énergie et ont une large portée de couverture. Ils peuvent détecter des sons dans des zones où la visibilité peut être obstruée. Des études récentes ont montré que les sons captés par des dispositifs audio peuvent fournir suffisamment d'informations sur les lieux pour détecter l'activité piétonne.
Cependant, il y a des défis qui nécessitent une investigation approfondie, comme la nécessité d'algorithmes avancés pour filtrer les sons utiles du bruit de fond, le placement des microphones pour une capture optimale des données, et la prise en compte des préoccupations en matière de confidentialité et d'anonymat des données.
Aperçu du jeu de données ASPED
Pour combler le manque de compréhension sur l'utilisation de l'audio pour détecter les piétons, nous avons réalisé des tests dans un cadre académique. Nous avons collecté des données pour voir à quel point les microphones pouvaient identifier la présence de piétons. Le jeu de données, appelé ASPED, sert de base à nos expériences utilisant des capteurs audio. Nous avons enregistré de l'audio avec des dispositifs d'enregistrement standard, associés à des séquences vidéo pour les besoins d'étiquetage.
Les données audio ont été collectées à deux endroits sur un campus universitaire près des zones de restauration, et l'enregistrement a été fait sur une période de quelques jours. Cela a donné un grand nombre de données vidéo et audio capturées, permettant d'analyser efficacement la présence de piétons.
Le jeu de données est biaisé ; il y a beaucoup plus de cadres sans piétons que ceux avec des piétons. Cet équilibre est important à considérer pour les modèles d'apprentissage automatique, car ils pourraient prédire tout de manière incorrecte s'ils ne sont pas conçus correctement.
Méthodologie pour la détection des piétons
Nous avons visé à atteindre deux objectifs à travers nos expériences :
- Identifier quand des piétons sont près des capteurs audio en utilisant des données audio, validées par des cadres vidéo.
- Prédire le nombre de piétons détectés en fonction des cadres vidéo.
Pour traiter les signaux audio, nous reconnaissons qu'ils se composent de divers sons qui se chevauchent. Certains sons, comme les pas, indiquent une activité piétonne, tandis que d'autres peuvent provenir du bruit de fond. Cela nécessite des techniques d'analyse audio sophistiquées. Nous avons construit un système qui traite les enregistrements audio pour prédire la présence de piétons.
Le système d'analyse audio utilise plusieurs méthodes pour classer les sons enregistrés. Nous avons formé différents modèles pour identifier quand des piétons sont présents dans l'audio. Ces modèles vont de l'utilisation de caractéristiques pré-entraînées à la construction de réseaux de neurones spécifiques conçus pour la classification audio.
Expérimentations avec l'entrée audio
Nous avons réalisé trois expériences principales pour comparer différentes méthodes d'analyse audio, testant l'efficacité de nos modèles.
Comparaison des modèles audio : Nous avons évalué la performance de chaque modèle d'analyse audio pour distinguer la présence de piétons selon différentes distances des capteurs.
Test de la taille du tampon : Nous avons vérifié comment la performance variait selon les distances des microphones, en nous attendant à ce que la proximité offre des signaux plus clairs.
Approche par seuil : Nous avons étudié comment différents critères pour compter les piétons affectaient les performances de détection, en gardant à l'esprit que des signaux plus forts étaient plus facilement détectés.
Pour remédier au déséquilibre des classes présent dans notre ensemble de données, nous avons mis en œuvre des techniques pour équilibrer nos données d'entraînement, garantissant que les deux classes de présence piétonne soient correctement représentées.
Prédiction des flux de piétons
Nous avons également exploré comment prédire les patterns piétonniers au fil du temps. Comprendre le flux de piétons peut aider dans de nombreux domaines, de l'amélioration de la sécurité publique à la planification urbaine. Pour réaliser la prédiction des flux de piétons, nous avons d'abord surveillé les comptages de piétons à l'aide de données vidéo et utilisé une méthode pour anticiper les futurs comptages en fonction des données passées.
Notre installation comprenait plusieurs enregistreurs audio et une caméra de surveillance dans une zone désignée. Bien que nos méthodes audio soient encore en développement, nous avons compté sur les données vidéo pour attribuer les comptages de piétons pour nos prédictions.
Notre objectif principal est de prévoir comment le trafic piéton change dans différentes zones. Nous avons noté que des approches mathématiques simples peuvent ne pas prendre en compte toutes les variations du trafic piéton, surtout pendant les périodes de pointe et hors pointe, donc nous avons utilisé un réseau de neurones convolutionnel (CNN) pour gérer ces complexités de manière plus efficace.
Résultats des expériences
D'après nos expériences, nous avons trouvé que les modèles conçus spécifiquement pour la détection des piétons fonctionnaient mieux que ceux qui étaient pré-entraînés pour d'autres tâches. La meilleure performance a été observée à des distances moyennes des dispositifs d'enregistrement. Nous avons également constaté que l'efficacité de la détection des piétons s'améliorait à mesure que le nombre de piétons augmentait.
Les résultats de la prédiction de flux indiquaient une grande précision pour les courtes distances, mais la performance a diminué à mesure que la distance augmentait en raison de la complexité ajoutée de la détection sur une plus grande zone. Cette constatation suggère que, bien que nos méthodes puissent fonctionner efficacement dans des environnements plus petits, les prédictions sur de plus grandes zones nécessitent un affinement supplémentaire.
Directions futures pour la technologie de détection audio
Bien que notre système de détection des piétons basé sur l'audio ait produit des résultats prometteurs, nous reconnaissons que des améliorations sont encore nécessaires. Un domaine clé est d'améliorer la technologie pour s'assurer qu'elle peut identifier clairement les sons des piétons, même dans des environnements urbains complexes avec beaucoup de bruit de fond.
Nous prévoyons d'élargir l'ensemble de données pour inclure différentes conditions urbaines, permettant à notre système de mieux s'adapter à divers scénarios. Avec les données audio ayant de potentiels problèmes de confidentialité, nous visons également à garantir que les conversations personnelles soient protégées lors de l'utilisation des données.
Notre ensemble de données peut servir de ressource précieuse pour les chercheurs et les urbanistes, aidant à gérer les flux piétonniers et à optimiser la conception des villes. En prédisant efficacement les mouvements piétonniers, les urbanistes peuvent prendre des décisions éclairées pour développer une infrastructure qui répond mieux aux besoins publics.
Conclusion
Cette étude offre des perspectives sur l'utilisation de la technologie audio pour surveiller le mouvement des piétons. Nos résultats suggèrent que les capteurs audio ont un potentiel pour une détection fiable des piétons et une prédiction des flux. Alors que les villes cherchent à améliorer la sécurité et l'accessibilité des piétons, cette approche basée sur l'audio pourrait soutenir les urbanistes dans la création de communautés plus dynamiques, sûres et réactives. Les efforts futurs se concentreront sur le perfectionnement des algorithmes, l'élargissement de l'ensemble de données et la résolution des problèmes de confidentialité pour améliorer la fiabilité de cette technologie prometteuse.
Titre: Understanding Pedestrian Movement Using Urban Sensing Technologies: The Promise of Audio-based Sensors
Résumé: While various sensors have been deployed to monitor vehicular flows, sensing pedestrian movement is still nascent. Yet walking is a significant mode of travel in many cities, especially those in Europe, Africa, and Asia. Understanding pedestrian volumes and flows is essential for designing safer and more attractive pedestrian infrastructure and for controlling periodic overcrowding. This study discusses a new approach to scale up urban sensing of people with the help of novel audio-based technology. It assesses the benefits and limitations of microphone-based sensors as compared to other forms of pedestrian sensing. A large-scale dataset called ASPED is presented, which includes high-quality audio recordings along with video recordings used for labeling the pedestrian count data. The baseline analyses highlight the promise of using audio sensors for pedestrian tracking, although algorithmic and technological improvements to make the sensors practically usable continue. This study also demonstrates how the data can be leveraged to predict pedestrian trajectories. Finally, it discusses the use cases and scenarios where audio-based pedestrian sensing can support better urban and transportation planning.
Auteurs: Chaeyeon Han, Pavan Seshadri, Yiwei Ding, Noah Posner, Bon Woo Koo, Animesh Agrawal, Alexander Lerch, Subhrajit Guhathakurta
Dernière mise à jour: 2024-06-14 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2406.09998
Source PDF: https://arxiv.org/pdf/2406.09998
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.