Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Aprendizagem de máquinas

A Importância da Detecção de Rostos com Máscara

Avaliar como as tecnologias atuais identificam rostos mascarados.

― 9 min ler


Desafios na Detecção deDesafios na Detecção deRostos com Máscararostos parcialmente escondidos.Analisando o desempenho em detectar
Índice

A Detecção de rostos melhorou bastante nos últimos anos, mas ainda enfrenta muitos desafios. Esses desafios incluem diferenças na aparência das pessoas com base na idade, gênero e na forma como seus rostos estão posicionados ou iluminados. Um desafio específico que surgiu recentemente é a detecção de rostos cobertos por máscaras. Esse problema se tornou importante devido à pandemia de COVID-19, que tornou o uso de máscaras comum em várias partes do mundo. Hoje, ainda não sabemos quão bem as tecnologias de detecção de rostos existentes conseguem identificar rostos mascarados.

Este artigo discute as principais tecnologias de detecção de rostos, especialmente aquelas que conseguem detectar rostos mascarados. Também analisamos os Conjuntos de dados existentes sobre rostos mascarados e avaliamos quão bem diferentes Modelos de detecção de rostos funcionam nesses rostos mascarados. Por fim, falamos sobre por que alguns modelos funcionam melhor que outros.

Contexto

A aprendizagem de máquina levou a avanços na detecção de objetos, e a detecção de rostos é uma parte chave desse campo. Nos últimos anos, as tecnologias de detecção de rostos melhoraram em velocidade e Precisão. Essas melhorias são importantes porque a detecção de rostos é usada em muitas áreas, incluindo segurança, vigilância e gerenciamento de conteúdo em vídeo.

Um bom sistema de detecção de rostos precisa lidar com várias coisas. Isso inclui diferentes idades, gêneros, tamanhos, condições de iluminação e obstruções como máscaras. Embora avanços tenham sido feitos para lidar com muitos desses fatores, ainda não existem muitas soluções focadas especificamente na detecção de rostos bloqueados por máscaras.

Durante a pandemia, muitos países exigiram que as pessoas usassem máscaras em público. Mesmo três anos depois, alguns lugares ainda exigem máscaras. Essa mudança fez com que algumas empresas adaptassem sua tecnologia, especialmente em celulares que usam reconhecimento facial. No entanto, muitas indústrias ainda dependem de sistemas mais antigos que não foram projetados para detectar rostos com máscaras. Portanto, é crucial descobrir como as tecnologias atuais se saem na detecção de rostos mascarados.

Importância da Detecção de Rostos Mascarados

A detecção de rostos mascarados é um ramo da detecção de rostos que se concentra em identificar rostos que estão parcialmente escondidos por máscaras. Essa tarefa ganhou importância devido à pandemia. Tradicionalmente, a detecção de rostos lidava apenas com rostos totalmente visíveis, mas isso mudou à medida que as pessoas começaram a usar máscaras regularmente.

Detectar rostos mascarados é mais difícil porque a máscara cobre parte do rosto, o que significa que o sistema tem menos informações para trabalhar. Além disso, embora tenha havido muita pesquisa sobre a detecção de rostos ocluídos, não há tanto foco especificamente em rostos mascarados. Como resultado, não muitos sistemas foram desenvolvidos para lidar com esse novo desafio de forma eficaz.

Revisão dos Modelos de Detecção de Rostos

Hoje, existem muitos modelos de detecção de rostos, mas podemos categorizá-los com base em vários fatores:

  1. Algoritmos Baseados em Âncoras vs. Algoritmos Sem Âncoras: Alguns modelos usam caixas âncoras, que são formas pré-definidas usadas para encontrar rostos em imagens. Exemplos disso são o PyramidBox e o RetinaFace. Outros modelos, como LFFD e CenterFace, não usam âncoras e, em vez disso, confiam em métodos diferentes para detectar rostos.

  2. Modelos de Uma Etapa vs. Modelos de Duas Etapas: Modelos de uma etapa como o RetinaFace analisam rapidamente imagens em busca de rostos, enquanto modelos de duas etapas como o Faster-R-CNN primeiro geram possíveis localizações de rostos e depois refinam essas previsões.

  3. Métodos Conscientes do Contexto: Alguns modelos levam em conta partes do corpo ao redor, o que pode ajudar a localizar rostos com precisão nas imagens.

  4. Aprendizado Multitarefa: Essa abordagem combina diferentes tarefas. Por exemplo, alguns modelos se concentram tanto em detectar rostos quanto em alinhá-los.

Quando se trata de detectar rostos mascarados, apenas alguns modelos foram criados e eles ainda são limitados em termos de desempenho. O modelo LLE-CNN e a Rede de Atenção Facial (FAN) estão entre os poucos que trabalham especificamente na detecção de rostos mascarados.

Objetivo do Estudo

O objetivo deste estudo é avaliar vários modelos de detecção de rostos para ver quão bem eles conseguem detectar rostos mascarados. Para isso, vamos:

  • Revisar as tecnologias atuais de detecção de rostos.
  • Examinar os conjuntos de dados existentes de rostos mascarados e ver suas limitações.
  • Simular um novo conjunto de dados de rostos mascarados.
  • Avaliar quão bem diferentes modelos se saem ao detectar rostos mascarados.

Metodologia

Nesta pesquisa, escolhemos algoritmos de detecção de rostos com arquiteturas e complexidades variadas. Optamos por modelos que variam de sistemas avançados com muitos parâmetros a modelos mais simples que podem rodar em dispositivos com poder computacional limitado.

Os modelos de detecção de rostos que consideramos vieram de vários anos, com alguns sendo introduzidos desde 2016. Usamos modelos que já estavam treinados em conjuntos de dados padrão, particularmente o conjunto de dados WIDER Face, que tem um vasto número de imagens de rostos para fins de treinamento e teste.

Para testar esses modelos, criamos um conjunto de dados de rostos mascarados escurecendo a metade inferior dos rostos no conjunto de dados WIDER Face. Assim, os modelos tiveram que encontrar rostos usando apenas a metade superior. Esse método garantiu que pudéssemos avaliar quão bem esses modelos conseguiam identificar rostos mascarados sem quaisquer preconceitos do processo de treinamento.

Conjuntos de Dados Existentes para Rostos Mascarados

Atualmente, há apenas alguns conjuntos de dados disponíveis para rostos mascarados. O conjunto de dados MAFA é um dos maiores, contendo mais de 30.000 imagens. No entanto, inclui imagens de rostos obstruídos por mãos e outros objetos, e não apenas por máscaras.

Outros conjuntos de dados incluem o Conjunto de Dados de Detecção de Rostos Mascarados (MFDD) e o Conjunto de Dados de Reconhecimento de Rostos Mascarados do Mundo Real (RMFRD), mas eles também têm limitações em termos de número de sujeitos únicos e qualidade das imagens.

Para superar as limitações dos conjuntos de dados existentes, criamos nosso próprio conjunto de dados modificando o conjunto de dados WIDER Face. O principal objetivo era simular um conjunto mais realista de rostos mascarados contra o qual os modelos atuais poderiam ser testados.

Implementação dos Modelos

Os modelos escolhidos possuem características únicas que contribuem para seu desempenho. Abaixo estão alguns destaques dos modelos de detecção de rostos mais conhecidos:

  • RetinaFace: Este modelo usa uma rede de backbone complexa e inclui recursos adicionais como detecção de marcos faciais, resultando em alta precisão. Ele se destaca na detecção tanto de rostos normais quanto mascarados devido à sua capacidade de analisar informações contextuais.

  • Detetor de Rostos Extremamente Pequenos (EXTD): O EXTD é um modelo leve com poucos parâmetros, permitindo que ele funcione em dispositivos de baixa potência. Ele utiliza um design inteligente que permite manter o desempenho enquanto mantém a demanda computacional baixa.

  • Detetor de Rostos Leve e Rápido (LFFD): Semelhante ao EXTD, o LFFD foi projetado para eficiência, mas adota uma abordagem diferente, confiando nos campos receptivos naturais dos neurônios em vez de caixas âncoras.

  • Redes Neurais Convolucionais em Cascata Multitarefa (MTCCN): Este modelo combina a detecção de rostos com tarefas de alinhamento. Ele usa uma cascata de redes para melhorar a precisão, ao mesmo tempo que é eficiente em seu processamento.

  • TinyFaces: Este modelo tem como objetivo detectar rostos pequenos e aproveita o contexto em que os rostos aparecem, o que é especialmente útil em imagens desafiadoras.

Resultados e Avaliação

Após testar os modelos no conjunto de dados original WIDER Face e no conjunto modificado com rostos mascarados, avaliamos quão bem cada modelo se saiu em ambos os cenários. No geral, encontramos que:

  • O RetinaFace teve o melhor desempenho nos conjuntos de validação Fácil e Médio.
  • No conjunto Difícil, o EXTD superou todos os outros, o que pode ser atribuído ao seu design focado em rostos menores.

Os resultados indicaram que, enquanto alguns modelos mostraram boa precisão ao detectar rostos mascarados, ainda há uma lacuna significativa, especialmente no conjunto de validação Difícil, onde o desempenho foi mais baixo.

Essa queda no desempenho provavelmente se deve ao aumento no número de rostos pequenos e parcialmente ocluídos no conjunto de teste, especialmente porque metade de cada rosto foi bloqueada. Isso destaca a necessidade de melhores conjuntos de treinamento que incluam uma ampla variedade de rostos mascarados para melhorar o desempenho futuro.

Discussão

O ponto principal das nossas descobertas é a importância de um conjunto de dados que represente com precisão a diversidade de rostos mascarados na vida real. Os modelos existentes se saíram razoavelmente bem com rostos não mascarados, mas enfrentam desafios quando encontram rostos com partes significativas obstruídas.

Alguns modelos conseguiram se adaptar melhor do que outros. Por exemplo, a dependência do RetinaFace em marcos ajudou a manter um alto nível de precisão, mas quando desafiado por imagens difíceis, ele teve dificuldades. Enquanto isso, o TinyFaces apresentou melhorias em cenários onde rostos pequenos eram predominantes.

As descobertas sugerem que treinar modelos de detecção de rostos especificamente em conjuntos de dados mascarados pode ajudar a melhorar o desempenho em todos os tipos de conjuntos de validação. As limitações atuais ressaltam a necessidade de criar conjuntos de dados ricos e variados que possam cobrir os cenários da vida real que enfrentamos hoje.

Conclusão

Detectar rostos mascarados é agora mais relevante do que nunca devido à pandemia que ainda estamos enfrentando. Os modelos de detecção de rostos mais avançados mostram resultados promissores quando se trata de detectar rostos mascarados, mas ainda há muito trabalho a ser feito.

Os desafios apresentados por rostos parcialmente ocultos sublinham a necessidade de conjuntos de dados aprimorados e mais pesquisas dedicadas à detecção de rostos mascarados. À medida que a tecnologia continua a avançar, enfrentar esses desafios será crucial para aplicações em segurança, vigilância e muito mais.

Mais de autores

Artigos semelhantes