Détection du stalking grâce à l'analyse vidéo
Une nouvelle méthode utilise l'analyse vidéo pour identifier les comportements de harcèlement dans les espaces publics.
― 8 min lire
Table des matières
Ces dernières années, on s'inquiète de plus en plus de la détection des crimes, surtout en ce qui concerne le harcèlement. Le harcèlement, un comportement qui précède souvent des crimes plus graves, représente un risque important, surtout pour les femmes dans les espaces publics. Malgré les avancées technologiques, ce domaine reste sous-exploité. Cet article présente une approche qui utilise la vision par ordinateur pour détecter les comportements de harcèlement via l'analyse vidéo.
Le Problème du Harcèlement
Le harcèlement est une forme de maltraitance où une personne suit, observe ou intimide une autre personne. Ce comportement peut mener à des crimes graves, y compris des agressions et même pire. Il est souvent invisible jusqu'à ce qu'il s'intensifie en un acte plus violent. Les statistiques montrent que le harcèlement est un problème répandu, avec de nombreuses personnes en faisant l'expérience sans qu'aucune action ne soit prise pour l'empêcher.
Les femmes sont particulièrement vulnérables au harcèlement, se sentant souvent en danger dans les lieux publics. Beaucoup d'études révèlent qu'un pourcentage significatif de femmes a été confronté à du harcèlement de rue, soulignant l'urgence de méthodes de détection efficaces.
Le Besoin de Détection
Détecter le comportement de harcèlement est crucial, car cela peut aider à prévenir les crimes graves. Si le harcèlement est identifié rapidement, les autorités peuvent intervenir avant qu'une situation ne dégénère. Cela a conduit à la nécessité de développer des systèmes capables de reconnaître automatiquement les scénarios de harcèlement.
La technologie actuelle, y compris l'intelligence artificielle, offre des outils prometteurs pour la détection des crimes, mais la détection des comportements de harcèlement reste un défi qui nécessite plus d'attention. Utiliser la surveillance vidéo pour surveiller les comportements dans les espaces publics est une solution potentielle.
Méthode Proposée
Cet article présente une méthode unique qui combine diverses technologies avancées, y compris des réseaux de neurones convolutionnels (CNN), des réseaux à mémoire à long et court terme (LSTM) et des perceptrons multicouches (MLP). Ce modèle hybride est conçu pour analyser les séquences vidéo en temps réel afin d'identifier les comportements de harcèlement.
Le système proposé vise à extraire des caractéristiques visuelles importantes des images vidéo, comme les mouvements du visage et les positions des individus. Ces caractéristiques sont ensuite classées pour indiquer si une situation de harcèlement est en cours.
Collecte de Données
Pour cette approche, un nouvel ensemble de données a été créé, comprenant des vidéos montrant à la fois des scénarios de harcèlement et de non-harcèlement. Cet ensemble inclut une variété de vidéos tirées de films et de télévision, assurant que les données représentent des situations réelles.
Le processus de collecte n'est pas simple ; beaucoup de vidéos ne montrent pas clairement le visage du harceleur, rendant difficile la collecte de preuves substantielles. Néanmoins, l'ensemble de données comprend 238 vidéos, avec un équilibre entre les scénarios de harcèlement et de non-harcèlement.
Traitement vidéo
Le système proposé traite les vidéos en plusieurs étapes. Dans un premier temps, des images individuelles sont extraites de la vidéo. Un retrait de l'arrière-plan est appliqué pour isoler les individus, facilitant l'analyse de leurs actions sans distractions provenant d'autres éléments de la scène.
Des points de repère faciaux-des points spécifiques sur le visage (comme les yeux, le nez et la bouche)-sont ensuite identifiés. Cela fournit des données vitales sur l'orientation des individus et sur leurs interactions.
Caractéristiques Clés
Trois principales caractéristiques sont extraites pour aider à l'identification des comportements :
Points de Repère Faciaux : Ces points sont cruciaux pour analyser les expressions faciales et les mouvements. Ils aident à identifier si quelqu'un observe ou suit de près une autre personne.
Estimation de l'Orientation de la Tête : En mesurant les angles d'orientation de la tête d'une personne, le système peut déterminer si elle est consciente de son environnement ou concentrée sur quelqu'un d'autre.
Mesure de Distance Relative : La distance entre deux individus est calculée. C'est important parce que le harcèlement implique souvent d'être de manière inconfortable près d'une autre personne sans son consentement.
Comment le Modèle Fonctionne
Le modèle fonctionne en plusieurs étapes. Après avoir extrait des images et des caractéristiques, les données sont traitées à travers la structure CNN-LSTM. Ici, le CNN est utilisé pour analyser les caractéristiques spatiales dans les images, tandis que le composant LSTM se concentre sur la compréhension des changements au fil du temps dans la vidéo.
Les informations sont ensuite combinées avec les résultats du MLP, qui traite les données numériques dérivées des caractéristiques. Cela permet une classification précise de si le comportement affiché dans la vidéo est un harcèlement ou non.
Évaluation de l'Efficacité
Pour évaluer l'efficacité de cette approche, des tests rigoureux ont été effectués. Le modèle a été entraîné sur une partie de l'ensemble de données, avec des données séparées réservées pour la validation et les tests. Cela garantit que la performance du modèle est mesurée sans biais.
Plusieurs métriques ont été utilisées pour évaluer la performance du modèle, y compris la précision, la précision, le rappel et la mesure F. Chacune de ces métriques fournit des aperçus uniques sur la capacité du modèle à identifier les comportements de harcèlement.
Résultats
Les résultats des expériences sont prometteurs. Le modèle hybride démontre un haut niveau de précision dans la distinction entre les comportements de harcèlement et de non-harcèlement. Cela suggère que la combinaison de CNN, LSTM et MLP capture efficacement les nuances du comportement humain dans les espaces publics.
De plus, le système montre que l'utilisation des points de repère faciaux, des angles d'orientation de la tête et des distances relatives améliore significativement la capacité du modèle à détecter le harcèlement dans les vidéos.
Discussion
Cette recherche aborde un manque critique dans le domaine de la détection des crimes, particulièrement en ce qui concerne le harcèlement. Bien que le modèle ait montré des résultats impressionnants, il existe des défis liés à la collecte de données et aux problèmes de confidentialité qui doivent être pris en compte dans les applications réelles.
L'étude met en lumière la nécessité de poursuivre la recherche et d'investir dans la technologie pour lutter contre le harcèlement. Mettre en œuvre de tels systèmes de détection dans la surveillance publique pourrait grandement améliorer la sécurité des individus, en particulier des femmes, dans les environnements urbains.
Travaux Futurs
À l'avenir, plusieurs pistes peuvent être explorées pour améliorer encore les systèmes de détection de harcèlement. Augmenter la taille et la diversité de l'ensemble de données pourrait améliorer l'entraînement du modèle. De plus, peaufiner le modèle pour réduire les faux positifs et améliorer la précision est essentiel pour un déploiement pratique.
Un autre domaine significatif pour la recherche future est l'impact éthique des technologies de surveillance. Trouver un équilibre entre la sécurité publique et les droits à la vie privée est crucial alors que ces systèmes deviennent plus courants. Engager la communauté et les parties prenantes dans des discussions sur la mise en œuvre de telles technologies peut conduire à une utilisation plus efficace et responsable.
Conclusion
La prévalence croissante du harcèlement nécessite le développement de systèmes de détection avancés. Le modèle hybride présenté dans cette étude offre une solution prometteuse, exploitant les techniques modernes de vision par ordinateur. Bien que des défis demeurent, cette approche souligne le potentiel de la technologie pour améliorer la sécurité dans les espaces publics.
Titre: A Computer Vision Based Approach for Stalking Detection Using a CNN-LSTM-MLP Hybrid Fusion Model
Résumé: Criminal and suspicious activity detection has become a popular research topic in recent years. The rapid growth of computer vision technologies has had a crucial impact on solving this issue. However, physical stalking detection is still a less explored area despite the evolution of modern technology. Nowadays, stalking in public places has become a common occurrence with women being the most affected. Stalking is a visible action that usually occurs before any criminal activity begins as the stalker begins to follow, loiter, and stare at the victim before committing any criminal activity such as assault, kidnapping, rape, and so on. Therefore, it has become a necessity to detect stalking as all of these criminal activities can be stopped in the first place through stalking detection. In this research, we propose a novel deep learning-based hybrid fusion model to detect potential stalkers from a single video with a minimal number of frames. We extract multiple relevant features, such as facial landmarks, head pose estimation, and relative distance, as numerical values from video frames. This data is fed into a multilayer perceptron (MLP) to perform a classification task between a stalking and a non-stalking scenario. Simultaneously, the video frames are fed into a combination of convolutional and LSTM models to extract the spatio-temporal features. We use a fusion of these numerical and spatio-temporal features to build a classifier to detect stalking incidents. Additionally, we introduce a dataset consisting of stalking and non-stalking videos gathered from various feature films and television series, which is also used to train the model. The experimental results show the efficiency and dynamism of our proposed stalker detection system, achieving 89.58% testing accuracy with a significant improvement as compared to the state-of-the-art approaches.
Auteurs: Murad Hasan, Shahriar Iqbal, Md. Billal Hossain Faisal, Md. Musnad Hossin Neloy, Md. Tonmoy Kabir, Md. Tanzim Reza, Md. Golam Rabiul Alam, Md Zia Uddin
Dernière mise à jour: 2024-02-05 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2402.03417
Source PDF: https://arxiv.org/pdf/2402.03417
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.