Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Avancées dans la technologie de reconnaissance de la démarche

De nouvelles méthodes améliorent la précision pour identifier les gens par leurs motifs de marche.

― 8 min lire


Percée en reconnaissancePercée en reconnaissancede la démarchemotifs de marche.précision de l'identification desDes méthodes innovantes améliorent la
Table des matières

La reconnaissance de la démarche est une méthode pour identifier les personnes en fonction de leur façon de marcher. Cette technique peut être utilisée à distance et ne nécessite pas que la personne coopère, ce qui la rend utile pour la sécurité et la surveillance. Alors que d'autres méthodes de reconnaissance, comme la reconnaissance par empreinte digitale ou par iris, se basent souvent sur des données facilement accessibles, la reconnaissance de la démarche rencontre des défis uniques. Les données de démarche ne peuvent pas être facilement collectées sur Internet. Du coup, les chercheurs travaillent à améliorer les systèmes de reconnaissance de la démarche en utilisant des technologies avancées.

Le Défi des Données d'Entraînement

Un problème majeur dans le développement des systèmes de reconnaissance de la démarche est le besoin de grandes quantités de données d'entraînement. Les méthodes d'apprentissage profond, qui sont devenues populaires pour la reconnaissance biométrique, nécessitent généralement des ensembles de données volumineux pour bien fonctionner. Cependant, alors que la reconnaissance faciale peut utiliser de grandes collections d'images sur le web, les données de démarche sont généralement limitées à de petits projets de recherche. Cette rareté rend difficile l'entraînement efficace des modèles.

Tirer Parti des Connaissances Existantes

Pour surmonter le manque de données, les chercheurs ont commencé à utiliser les connaissances existantes sur les formes et mouvements humains. En ajustant un modèle 3D du corps humain aux vidéos de démarche, ils peuvent extraire des infos utiles sur la façon dont une personne marche. Ce modèle, appelé Modèle SMPL, donne des informations sur la forme et le mouvement du corps tout en aidant à surmonter les limitations des données.

Améliorer la Cohérence des Mouvements

Même avec un bon modèle, garantir que les mouvements semblent cohérents dans le temps peut être problématique. Les chercheurs ont résolu ce souci en introduisant une nouvelle méthode qui aide à maintenir la cohérence des mouvements tout au long des séquences vidéo. Cette méthode utilise des concepts issus des Systèmes dynamiques linéaires. En appliquant ces concepts, le modèle peut prédire les mouvements futurs en se basant sur ceux du passé, ce qui donne des représentations de démarche plus réalistes.

Comparaison avec les Méthodes Traditionnelles

La nouvelle méthode a été comparée à des techniques traditionnelles, comme un type d'apprentissage appelé apprentissage adversarial. Les chercheurs ont utilisé des ensembles de données contenant des vidéos de marche de plusieurs individus pour évaluer l'efficacité de leur approche. Les résultats ont montré que leur méthode, qui utilise la nouvelle technique de cohérence, a atteint une meilleure précision avec moins de données d'entraînement que les méthodes traditionnelles.

Avantages de la Nouvelle Approche

Le modèle récent a montré des avantages significatifs dans l'identification des individus, surtout dans des situations difficiles. Par exemple, quand les jambes d'une personne sont bloquées de la vue, le nouveau modèle peut quand même capturer son mouvement avec précision, ce qui pose souvent problème aux méthodes traditionnelles. Cette robustesse le rend plus fiable pour des applications réelles.

Types d'Approches de Reconnaissance de la Démarche

La reconnaissance de la démarche peut être divisée en deux grandes catégories : les approches basées sur l'apparence et les approches basées sur le modèle.

  • Approches Basées sur l'Apparence : Ces méthodes extraient des caractéristiques directement à partir d'images d'individus en marche. Elles analysent les silhouettes des corps pour identifier des motifs et des caractéristiques.

  • Approches Basées sur le Modèle : Ces techniques impliquent d'abord d'ajuster un modèle corporel humain aux images. Après l'ajustement, elles dérivent des caractéristiques à partir des éléments du modèle. Cette approche basée sur le modèle tend à offrir une meilleure précision mais nécessite un traitement plus complexe.

Le Besoin de Données Réalistes

La taille limitée des ensembles de données de démarche disponibles freine le développement de systèmes de reconnaissance plus efficaces. Les chercheurs visent à surmonter ce défi en intégrant des connaissances antérieures et des techniques de représentation dans leurs modèles. En utilisant le modèle SMPL, ils peuvent mieux gérer les variations de forme et de mouvement, ce qui permet d'améliorer la précision de la reconnaissance.

Le Rôle des Systèmes Dynamiques Linéaires

Le concept de systèmes dynamiques linéaires joue un rôle crucial dans la garantie que les mouvements représentés dans le modèle sont cohérents et réalistes. En appliquant ce concept, les chercheurs peuvent s'assurer que les mouvements sont périodiques et prévisibles, ce qui est essentiel pour reconnaître efficacement les motifs de démarche.

Développement du Nouveau Modèle

Ce nouveau modèle combine plusieurs approches pour créer un système de reconnaissance de la démarche plus efficace. Il fonctionne en suivant les individus dans les vidéos, en reconstruisant leur représentation corporelle 3D, puis en décrivant leur démarche pour des fins de correspondance.

Suivi des Individus

La première étape du processus est de détecter les individus dans les images vidéo. Les chercheurs utilisent des méthodes de détection modernes pour créer des boîtes englobantes autour des personnes dans la vidéo. Après le suivi des individus, le système peut analyser leurs mouvements et extraire des caractéristiques pertinentes.

Reconstruction 3D

Une fois les individus suivis, l'étape suivante consiste à reconstruire leur représentation corporelle 3D en utilisant le modèle SMPL. Cette reconstruction donne une compréhension détaillée de la façon dont une personne se déplace et apparaît en marchant.

Description de la Démarche pour Correspondance

La dernière étape est de décrire la démarche en créant une représentation qui peut distinguer entre les individus. Cette représentation combine à la fois des informations de forme et de mouvement pour créer un profil complet de la façon dont une personne marche.

L'Importance des Fonctions de Perte

Pour entraîner leur modèle efficacement, les chercheurs ont utilisé plusieurs fonctions de perte qui guident le processus d'apprentissage. Ces fonctions aident le modèle à optimiser ses performances en minimisant la différence entre les prédictions et les données réelles.

  • Perte de Reconstruction Douce : Cette approche aide à s'assurer que le modèle conserve des représentations valides de la forme et du mouvement du corps.

  • Perte d'Identité : Cette fonction encourage le modèle à utiliser à la fois des informations de forme et de mouvement lorsqu'il crée des profils uniques pour les individus.

  • Perte de Mouvement : Cet aspect implique deux méthodes : l'apprentissage adversarial traditionnel et la nouvelle approche basée sur les systèmes dynamiques linéaires. La perte de mouvement favorise des motifs de démarche réalistes sans avoir besoin de données d'entraînement supplémentaires.

Évaluation et Résultats

Les chercheurs ont testé leur nouveau modèle sur deux ensembles de données différents contenant des séquences de démarche de divers sujets. Les ensembles de données ont été collectés dans des environnements contrôlés, et les participants ont donné leur consentement éclairé.

Ensemble de Données HumanID

L'ensemble de données HumanID se compose de séquences vidéo capturées dans diverses conditions, y compris différents types de chaussures et de vêtements. L'évaluation a montré que le nouveau modèle a surpassé les méthodes précédentes dans l'identification des individus à travers différents scénarios.

Ensemble de Données CASIA-B

L'ensemble de données CASIA-B comprend des séquences de démarche enregistrées sous différents angles et conditions. Bien que le nouveau modèle ait également bien performé ici, les avantages offerts par l'approche des systèmes dynamiques linéaires étaient légèrement moins marqués par rapport à l'ensemble HumanID.

Applications Potentielles et Impact Sociétal

La technologie de reconnaissance de la démarche a de nombreuses applications potentielles, principalement dans la sécurité et la surveillance. Cependant, elle soulève aussi des questions éthiques concernant la vie privée et le consentement. À mesure que la technologie devient plus répandue, il est essentiel que les chercheurs continuent de souligner l'importance d'une utilisation responsable et d'un encadrement.

Les avantages potentiels de la reconnaissance de la démarche incluent l'identification des individus disparus ou la surveillance d'activités suspectes. Dans la vie quotidienne, cela pourrait également conduire à des innovations dans le commerce, comme des magasins sans caisses traditionnelles.

Conclusion

Les chercheurs ont développé une méthode prometteuse de reconnaissance de la démarche qui intègre un modèle corporel humain 3D avec des techniques de systèmes dynamiques linéaires. Les résultats montrent des améliorations significatives en termes de performance tout en minimisant le besoin de grands ensembles de données d'entraînement. Ce développement ouvre de nouvelles possibilités pour les applications de reconnaissance de la démarche et souligne l'importance de la recherche continue dans ce domaine.

Source originale

Titre: Reducing Training Demands for 3D Gait Recognition with Deep Koopman Operator Constraints

Résumé: Deep learning research has made many biometric recognition solution viable, but it requires vast training data to achieve real-world generalization. Unlike other biometric traits, such as face and ear, gait samples cannot be easily crawled from the web to form massive unconstrained datasets. As the human body has been extensively studied for different digital applications, one can rely on prior shape knowledge to overcome data scarcity. This work follows the recent trend of fitting a 3D deformable body model into gait videos using deep neural networks to obtain disentangled shape and pose representations for each frame. To enforce temporal consistency in the network, we introduce a new Linear Dynamical Systems (LDS) module and loss based on Koopman operator theory, which provides an unsupervised motion regularization for the periodic nature of gait, as well as a predictive capacity for extending gait sequences. We compare LDS to the traditional adversarial training approach and use the USF HumanID and CASIA-B datasets to show that LDS can obtain better accuracy with less training data. Finally, we also show that our 3D modeling approach is much better than other 3D gait approaches in overcoming viewpoint variation under normal, bag-carrying and clothing change conditions.

Auteurs: Cole Hill, Mauricio Pamplona Segundo, Sudeep Sarkar

Dernière mise à jour: 2023-08-14 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2308.07468

Source PDF: https://arxiv.org/pdf/2308.07468

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires