Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Apresentando o Dataset Celeb-FBI para Análise de Imagens de Corpo Inteiro

Um novo conjunto de dados ajuda a prever traços individuais a partir de imagens de corpo inteiro.

― 6 min ler


Celeb-FBI: Um NovoCeleb-FBI: Um NovoConjunto de DadosBiométricosindividuais a partir de imagens.previsões de característicasO conjunto de dados melhora as
Índice

Nos campos de vigilância, identificação e saúde, os pesquisadores frequentemente enfrentam a falta de Conjuntos de dados detalhados. Esse desafio dificulta a criação e a melhoria de novas técnicas. Ter um conjunto de dados com Imagens de corpo inteiro que inclui informações importantes como altura, peso, idade e gênero é especialmente importante. Essas informações podem ajudar em áreas como moda, análise esportiva e criação de avatares virtuais.

Para preencher essa lacuna, foi criado um novo conjunto de dados chamado ‘Celeb-FBI’. Esse conjunto inclui 7.211 imagens de corpo inteiro de diferentes indivíduos, junto com detalhes sobre altura, idade, peso e gênero. O conjunto de dados também passa por várias etapas de pré-processamento, que incluem limpeza das imagens, redimensionamento e balanceamento do conjunto de dados criando amostras artificiais por meio de um método chamado SMOTE.

Com o conjunto de dados preparado, três Modelos de aprendizado profundo foram testados: Rede Neural Convolucional (CNN), ResNet de 50 camadas e VGG de 16 camadas. Esses modelos foram projetados para estimar a altura, peso, idade e gênero dos indivíduos a partir de suas imagens de corpo inteiro. Os resultados mostraram que o modelo ResNet-50 teve o melhor desempenho entre os três modelos.

Propósito do Conjunto de Dados

O principal objetivo de criar esse conjunto de dados é prever o gênero de um indivíduo junto com outros detalhes importantes como idade, altura e peso a partir da imagem de corpo inteiro. Essas previsões são tratadas como um problema de classificação multilabel, onde cada atributo é considerado uma classe separada. Embora tenha havido progresso no reconhecimento facial, esse conjunto de dados visa melhorar métodos que podem lidar com imagens de corpo inteiro.

A maioria das pesquisas existentes em biometria foca em combinar imagens ou prever Atributos específicos de forma independente. O conjunto de dados Celeb-FBI permite uma análise abrangente capturando múltiplos atributos de uma única imagem. Além disso, há poucos conjuntos de dados disponíveis publicamente que incluam imagens de corpo inteiro, tornando este conjunto valioso para os pesquisadores.

Características do Conjunto de Dados Celeb-FBI

O conjunto de dados Celeb-FBI tem várias características principais:

  1. Informações Biométricas Diversificadas: Inclui uma variedade de informações biométricas de imagens de corpo inteiro, tornando-o útil para aplicações do mundo real, como segurança e saúde.

  2. Imagens de Celebridades: O conjunto é baseado em imagens de corpo inteiro de celebridades populares. Essa diversidade é benéfica para aplicações de aprendizado de máquina.

  3. Coleta Abrangente de Dados: Um total de 7.211 imagens foi coletado, com 4.377 de mulheres e 2.834 de homens, garantindo uma representação equilibrada de diferentes gêneros.

  4. Organização Amigável ao Usuário: As imagens são organizadas sistematicamente e têm alta resolução para apoiar várias análises e treinamentos.

  5. Sem Duplicatas: O conjunto de dados foi limpo para garantir que não haja imagens duplicadas.

Desafios no Conjunto de Dados

O conjunto de dados enfrenta alguns desafios. Por exemplo, certos atributos como idade acima de 80, peso acima de 60 kg e instâncias de altura incomuns podem ter menos representação, levando a um conjunto de dados desequilibrado. Para lidar com isso, o SMOTE foi aplicado para criar amostras mais equilibradas para treinamento.

O conjunto de dados serve como um recurso de treinamento para pesquisadores que podem trabalhar no desenvolvimento de modelos capazes de prever múltiplos atributos individuais. No entanto, garantir precisão na estimativa desses atributos permanece complexo, já que até mesmo humanos acham difícil julgar a idade ou peso de alguém apenas pela aparência.

Garantindo a Qualidade dos Dados

A qualidade dos dados é crucial para garantir a confiabilidade desse conjunto. Validadores verificaram todas as imagens e as informações associadas quanto à precisão. Eles cruzaram os dados com fontes confiáveis e resolveram qualquer discrepância. O processo de validação envolveu indivíduos com formações acadêmicas relevantes para minimizar viés.

Composição do Conjunto de Dados

O conjunto de dados Celeb-FBI consiste em imagens coletadas de várias plataformas online. Inicialmente, 9.500 sujeitos foram considerados, mas devido a problemas de qualidade e à ausência de imagens, esse número foi reduzido para 7.211. Os dados foram organizados em um arquivo Excel, detalhando o nome da celebridade, altura, peso, idade e gênero.

As imagens foram obtidas de motores de busca populares, garantindo que não estivessem protegidas por direitos autorais. Cada imagem é nomeada usando um formato específico que inclui altura, peso, gênero e idade para fácil identificação.

Metodologia para Análise de Dados

O processo de análise do conjunto de dados envolve várias etapas. Inicialmente, as imagens são limpas para remover aquelas sem informações completas de atributos. As imagens são redimensionadas para uniformidade e depois balanceadas usando SMOTE. Esse balanceamento ajuda a melhorar o desempenho dos modelos de classificação.

Modelos de aprendizado profundo são então utilizados para classificar atributos como idade, gênero, altura e peso. O desempenho de diferentes modelos é comparado, com modelos selecionados usados para classificações precisas.

Avaliação do Desempenho do Modelo

Para avaliar o desempenho dos modelos, várias métricas como precisão, exatidão, recall e F1-score são usadas. Essas métricas fornecem insights sobre o quão bem cada modelo se sai na previsão de cada atributo. Os resultados mostraram que o modelo ResNet-50 consistentemente superou os outros, especialmente em precisão para previsão de idade e gênero.

Direções Futuras

O conjunto de dados Celeb-FBI apresenta oportunidades para pesquisas e desenvolvimentos futuros. Os pesquisadores podem trabalhar para aumentar o tamanho e a diversidade do conjunto de dados. Também há potencial para usar esse conjunto para desenvolver modelos que preveem o Índice de Massa Corporal (IMC) e outros métricas de saúde diretamente a partir de imagens de corpo inteiro.

Esse conjunto de dados pode ser benéfico na saúde, fornecendo insights que podem ajudar no diagnóstico e na tomada de decisões. Ao melhorar o acesso a conjuntos de dados abrangentes, os pesquisadores podem continuar avançando em áreas como reconhecimento biométrico, que tem aplicações práticas significativas.

Conclusão

O conjunto de dados Celeb-FBI é um recurso crucial que atende à necessidade de conjuntos de dados de imagens de corpo inteiro com atributos ricos. Ele abre caminho para previsões mais precisas de altura, peso, idade e gênero. Os resultados obtidos de modelos de aprendizado profundo como o ResNet-50 demonstram o potencial desses avanços em visão computacional, especialmente para reconhecimento biométrico a partir de imagens de corpo inteiro. Este conjunto de dados deve ajudar em várias áreas, incluindo segurança e saúde, tornando-se uma contribuição significativa para os esforços de pesquisa em andamento.

Fonte original

Título: Celeb-FBI: A Benchmark Dataset on Human Full Body Images and Age, Gender, Height and Weight Estimation using Deep Learning Approach

Resumo: The scarcity of comprehensive datasets in surveillance, identification, image retrieval systems, and healthcare poses a significant challenge for researchers in exploring new methodologies and advancing knowledge in these respective fields. Furthermore, the need for full-body image datasets with detailed attributes like height, weight, age, and gender is particularly significant in areas such as fashion industry analytics, ergonomic design assessment, virtual reality avatar creation, and sports performance analysis. To address this gap, we have created the 'Celeb-FBI' dataset which contains 7,211 full-body images of individuals accompanied by detailed information on their height, age, weight, and gender. Following the dataset creation, we proceed with the preprocessing stages, including image cleaning, scaling, and the application of Synthetic Minority Oversampling Technique (SMOTE). Subsequently, utilizing this prepared dataset, we employed three deep learning approaches: Convolutional Neural Network (CNN), 50-layer ResNet, and 16-layer VGG, which are used for estimating height, weight, age, and gender from human full-body images. From the results obtained, ResNet-50 performed best for the system with an accuracy rate of 79.18% for age, 95.43% for gender, 85.60% for height and 81.91% for weight.

Autores: Pronay Debnath, Usafa Akther Rifa, Busra Kamal Rafa, Ali Haider Talukder Akib, Md. Aminur Rahman

Última atualização: 2024-07-03 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2407.03486

Fonte PDF: https://arxiv.org/pdf/2407.03486

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes