Présentation du jeu de données Celeb-FBI pour l'analyse d'images en plein corps
Un nouveau jeu de données aide à prédire des traits individuels à partir d'images en corps entier.
― 7 min lire
Table des matières
Dans les domaines de la surveillance, de l'identification et de la santé, les chercheurs galèrent souvent à cause du manque de Jeux de données détaillés. Ce défi rend difficile la création et l'amélioration de nouvelles techniques. Avoir un jeu de données avec des Images de corps entiers incluant des infos importantes comme la taille, le poids, l'âge et le sexe est super important. Ces infos peuvent aider dans des domaines comme la mode, l'analyse sportive et la création d'avatars virtuels.
Pour combler ce vide, un nouveau jeu de données appelé 'Celeb-FBI' a été créé. Ce jeu de données inclut 7 211 images de corps entiers de différentes personnes avec des détails sur leur taille, âge, poids et sexe. Le jeu de données passe aussi par plusieurs étapes de prétraitement. Ça comprend le nettoyage des images, leur redimensionnement et l'équilibrage du jeu de données en créant des échantillons artificiels grâce à une méthode appelée SMOTE.
Avec le jeu de données préparé, trois Modèles de deep learning ont été testés : le Réseau de Neurones Convolutifs (CNN), le ResNet à 50 couches et le VGG à 16 couches. Ces modèles ont été conçus pour estimer la taille, le poids, l'âge et le sexe des gens à partir de leurs images de corps entiers. Les résultats ont montré que le modèle ResNet-50 était le plus performant parmi les trois.
Objectif du jeu de données
Le but principal de la création de ce jeu de données est de prédire le sexe d'une personne ainsi que d'autres infos importantes comme l'âge, la taille et le poids à partir de son image de corps entier. Ces prédictions sont considérées comme un problème de classification multilabel, où chaque attribut est vu comme une classe distincte. Bien qu'il y ait eu des avancées dans la reconnaissance faciale, ce jeu de données vise à améliorer les méthodes qui peuvent gérer les images de corps entiers.
La plupart des recherches existantes en biométrie se concentrent sur la mise en correspondance d'images ou la prédiction d'Attributs spécifiques indépendamment. Le jeu de données Celeb-FBI permet une analyse complète en capturant plusieurs attributs à partir d'une seule image. En plus, il y a peu de jeux de données disponibles publiquement qui incluent des images de corps entiers, rendant ce jeu précieux pour les chercheurs.
Caractéristiques du jeu de données Celeb-FBI
Le jeu de données Celeb-FBI a plusieurs caractéristiques clés :
Infos biométriques variées : Il inclut une variété d'infos biométriques provenant d'images de corps entiers, ce qui le rend utile pour des applications réelles comme la sécurité et la santé.
Images de célébrités : Le jeu est basé sur des images de corps entiers de célébrités populaires. Cette diversité est bénéfique pour les applications d'apprentissage automatique.
Collecte de données complète : Un total de 7 211 images a été collecté, avec 4 377 provenant de femmes et 2 834 d'hommes, garantissant une représentation équilibrée des différents sexes.
Organisation conviviale : Les images sont organisées de façon systématique et de haute résolution pour soutenir diverses analyses et formations.
Pas de doublons : Le jeu de données est nettoyé pour garantir qu'il n'y ait pas d'images en double.
Défis du jeu de données
Le jeu de données fait face à certains défis. Par exemple, certains attributs comme l'âge au-delà de 80 ans, le poids au-delà de 60 kg, et des cas de taille inhabituels peuvent avoir moins de représentation, ce qui peut entraîner un déséquilibre. Pour y remédier, SMOTE a été appliqué pour créer des échantillons plus équilibrés pour l'entraînement.
Le jeu de données sert de ressource de formation pour les chercheurs qui peuvent travailler sur le développement de modèles capables de prédire plusieurs attributs individuels. Cependant, assurer la précision de l'estimation de ces attributs reste complexe, car même les humains trouvent cela difficile de juger de l'âge ou du poids de quelqu'un juste en se basant sur son apparence.
Assurer la qualité des données
La qualité des données est cruciale pour garantir la fiabilité de ce jeu de données. Les validateurs ont vérifié toutes les images et les infos associées pour leur exactitude. Ils ont vérifié les données avec des sources fiables et résolu toute divergence. Le processus de validation impliquait des personnes avec des antécédents académiques pertinents pour minimiser les biais.
Composition du jeu de données
Le jeu de données Celeb-FBI se compose d'images collectées sur diverses plateformes en ligne. Au départ, 9 500 sujets ont été considérés, mais en raison de problèmes de qualité et d'absence d'images, ce nombre a été réduit à 7 211. Les données ont été organisées dans un fichier Excel, détaillant le nom de la célébrité, la taille, le poids, l'âge et le sexe.
Les images ont été obtenues à partir de moteurs de recherche populaires, en s'assurant qu'elles n'étaient pas protégées par des droits d'auteur. Chaque image est nommée selon un format spécifique incluant la taille, le poids, le sexe et l'âge pour une identification facile.
Méthodologie pour l'analyse des données
Le processus d'analyse du jeu de données implique plusieurs étapes. D'abord, les images sont nettoyées pour éliminer celles sans info d'attributs complets. Les images sont redimensionnées pour l'uniformité et ensuite équilibrées en utilisant SMOTE. Cet équilibrage aide à améliorer la performance des modèles de classification.
Des modèles de deep learning sont alors utilisés pour classifier les attributs comme l'âge, le sexe, la taille et le poids. La performance de différents modèles est comparée, avec des modèles sélectionnés pour des classifications précises.
Évaluation de la performance des modèles
Pour évaluer la performance des modèles, divers métriques comme la précision, le rappel et le score F1 sont utilisés. Ces métriques donnent un aperçu de la façon dont chaque modèle performe dans la prédiction de chaque attribut. Les résultats ont montré que le modèle ResNet-50 surpassait constamment les autres, surtout en précision pour la prédiction de l'âge et du sexe.
Directions futures
Le jeu de données Celeb-FBI présente des opportunités pour des recherches et développements futurs. Les chercheurs peuvent travailler à améliorer la taille et la diversité du jeu de données. Il y a aussi un potentiel d'utiliser ce jeu de données pour développer des modèles qui prédisent l'IMC et d'autres métriques de santé directement à partir d'images de corps entiers.
Ce jeu de données pourrait être bénéfique en santé, offrant des insights qui peuvent aider au diagnostic et à la prise de décision. En améliorant l'accès à des jeux de données complets, les chercheurs peuvent continuer à avancer dans des domaines comme la reconnaissance biométrique, qui a des applications pratiques significatives.
Conclusion
Le jeu de données Celeb-FBI est une ressource cruciale qui répond au besoin de jeux de données d'images de corps entiers avec des attributs riches. Il ouvre la voie à des prédictions plus précises de la taille, du poids, de l'âge et du sexe. Les résultats obtenus à partir de modèles de deep learning comme le ResNet-50 montrent le potentiel de ces avancées en vision par ordinateur, surtout pour la reconnaissance biométrique à partir d'images de corps entiers. Ce jeu de données devrait aider divers domaines, y compris la sécurité et la santé, en faisant une contribution significative aux efforts de recherche en cours.
Titre: Celeb-FBI: A Benchmark Dataset on Human Full Body Images and Age, Gender, Height and Weight Estimation using Deep Learning Approach
Résumé: The scarcity of comprehensive datasets in surveillance, identification, image retrieval systems, and healthcare poses a significant challenge for researchers in exploring new methodologies and advancing knowledge in these respective fields. Furthermore, the need for full-body image datasets with detailed attributes like height, weight, age, and gender is particularly significant in areas such as fashion industry analytics, ergonomic design assessment, virtual reality avatar creation, and sports performance analysis. To address this gap, we have created the 'Celeb-FBI' dataset which contains 7,211 full-body images of individuals accompanied by detailed information on their height, age, weight, and gender. Following the dataset creation, we proceed with the preprocessing stages, including image cleaning, scaling, and the application of Synthetic Minority Oversampling Technique (SMOTE). Subsequently, utilizing this prepared dataset, we employed three deep learning approaches: Convolutional Neural Network (CNN), 50-layer ResNet, and 16-layer VGG, which are used for estimating height, weight, age, and gender from human full-body images. From the results obtained, ResNet-50 performed best for the system with an accuracy rate of 79.18% for age, 95.43% for gender, 85.60% for height and 81.91% for weight.
Auteurs: Pronay Debnath, Usafa Akther Rifa, Busra Kamal Rafa, Ali Haider Talukder Akib, Md. Aminur Rahman
Dernière mise à jour: 2024-07-03 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2407.03486
Source PDF: https://arxiv.org/pdf/2407.03486
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.