Atingindo Reconhecimento de Pedestres em Tempo Real em Dispositivos de Baixo Consumo

Índice

Fonte original
Ligações de referência

O reconhecimento de pedestres é importante pra várias coisas, como segurança, carros autônomos e até fotos aéreas. É especialmente crucial pra dispositivos móveis, onde o poder de processamento é limitado. Essa tarefa pode ser difícil por causa das limitações dos dispositivos pequenos. Neste texto, vamos ver como conseguir um reconhecimento de pedestres em tempo real em computadores pequenos com baixo poder de processamento, tentando fazer isso da forma mais rápida possível.

A gente propõe três métodos pra ajudar nessa tarefa em computadores pequenos. O primeiro método usa técnicas aprimoradas baseadas em Padrões Binários Locais (LBP) e um classificador chamado AdaBoost. O segundo método refina o Histograma de Gradientes Orientados (HOG) e utiliza uma Máquina de Vetores de Suporte (SVM). O terceiro método acelera Redes Neurais Convolucionais (CNNs). Nossos resultados mostram que os três métodos conseguem reconhecer pedestres em tempo real com mais de 95% de precisão e conseguem processar mais de 5 frames por segundo, mesmo em sistemas compactos com um processador Intel i5 de 1.8 GHz.

A visão computacional, que ajuda máquinas a "verem", é usada agora em várias áreas, incluindo médica, militar e entretenimento. Reconhecer pessoas em imagens e vídeos é especialmente importante, mas também é bem desafiador. Essa tarefa afeta várias áreas da vida, desde sistemas de segurança até casas inteligentes e até robôs que ajudam idosos.

Para dispositivos móveis, existem problemas específicos que fazem o reconhecimento de pedestres ser difícil. Esses dispositivos costumam ter pouca energia e espaço pro hardware. Por exemplo, drones precisam caber baterias pequenas e computadores compactos, o que aumenta o desafio de reconhecer pedestres em tempo real.

Quando falamos sobre reconhecer pedestres, focamos em pessoas paradas ou andando. A complexidade surge do quanto uma pessoa pode parecer diferente em várias imagens. Fatores como a pose da pessoa, roupa, obstruções e até iluminação podem mudar como ela aparece numa imagem. Um fundo muito cheio também pode confundir o processo de reconhecimento. Essa diversidade na aparência das pessoas torna a tarefa de reconhecer pedestres complicada em dispositivos com poder de computação limitado.

Embora Redes Neurais Convolucionais (CNNs) tenham se tornado populares pro reconhecimento de objetos, elas exigem um poder de processamento considerável. Muitos estudos existentes tentaram acelerar o reconhecimento de pedestres, mas a maioria desses métodos depende de unidades de processamento gráfico (GPUs) poderosas em vez de CPUs comuns. Nosso trabalho foca em como implementar reconhecimento de pedestres em sistemas menores e menos potentes.

Em nosso estudo, focamos em três métodos:

Características LBP com AdaBoost: Aprimoramos a extração de características com LBP, que é bom em capturar formas e contornos, combinado com AdaBoost, que é um classificador rápido. Esse método visa acelerar o processo de reconhecimento, mantendo a precisão.
Características HOG com SVM: A técnica HOG captura os contornos dos objetos, mas implementações tradicionais podem ser lentas. Nós focamos em otimizar esse processo e combiná-lo com SVM, que oferece boa velocidade e precisão no reconhecimento.
Implementação Rápida de CNN: Nós analisamos uma versão rápida das CNNs pra aplicá-las em nosso contexto, melhorando métodos que costumam rodar devagar em dispositivos compactos.

Pra testar esses métodos, definimos duas condições principais de desempenho: o sistema precisa funcionar em tempo real, processando imagens a um mínimo de 5 frames por segundo, e precisa manter um nível de precisão acima de 95%.

Através da nossa pesquisa, encontramos que muitas técnicas existentes, embora altamente precisas, exigem recursos significativos, geralmente disponíveis só em GPUs. Algumas soluções interessantes foram projetadas pra funcionar em hardwares específicos feitos pra tarefas como detecção de objetos em tempo real, mas não são adequadas pra dispositivos gerais.

Escolhemos nosso hardware com cuidado, optando por um microcomputador Intel NUC compacto. Esse dispositivo encontra um equilíbrio entre tamanho, potência e preço, tornando-se adequado pros nossos objetivos. Ele tem um processador Intel Core i5 de 1.80 GHz, que é bom o suficiente pra nossos testes e permite portabilidade em vários sistemas.

Os conjuntos de dados usados pra treinar e testar nossos métodos incluem o conjunto de dados de pedestres INRIA e os conjuntos de dados de Classes de Objetos Visuais (VOC), que contêm várias imagens de pedestres de diferentes ângulos e poses. Combinamos esses conjuntos de dados pra criar um sistema robusto pra testar o reconhecimento de pedestres.

Quando falamos sobre nossos métodos, destacamos primeiro as características LBP e AdaBoost. Historicamente, o LBP é calculado comparando pixels adjacentes. Nós adotamos uma versão mais eficiente que acelera esse processo significativamente, mantendo a eficácia no reconhecimento de pedestres.

Depois, analisamos HOG e SVM. O método HOG envolve calcular gradientes entre pixels, o que pode ser lento, mas otimizamos o cache e pré-processamos os dados pra aumentar a velocidade. Isso envolveu ajustar vários parâmetros pra alcançar um bom equilíbrio entre velocidade e precisão.

Pra CNNs, transformamos nossos dados em imagens em tons de cinza. Essa simplificação reduz o processamento necessário e ajuda a acelerar o reconhecimento. No entanto, também notamos que os métodos existentes tinham algumas limitações, especialmente em relação a como redimensionam as imagens. Analisamos como diferentes tamanhos de amostras afetam o reconhecimento e notamos a necessidade de uma abordagem padrão.

Na seção de resultados, focamos em dois principais indicadores de desempenho: falsos positivos por imagem (FPPI) e a taxa de misses. Essas métricas ajudam a avaliar a precisão dos nossos métodos de detecção de pedestres. O objetivo é minimizar falsos positivos e reconhecimentos perdidos pra uma detecção de pedestres eficaz.

Depois de realizar nossos experimentos, percebemos que o método LBP com AdaBoost teve o melhor desempenho geral. Isso foi principalmente devido à sua rápida extração de características e classificação eficiente. O modelo CNN, embora mais lento, proporcionou a maior precisão, confirmando a eficácia das abordagens de aprendizado profundo.

Olhando pra frente, temos várias ideias pra melhorias futuras. Pretendemos otimizar ainda mais os processos, especialmente pros métodos HOG e SVM, focando em reduzir cálculos redundantes. Ao identificar as características mais significativas pro reconhecimento de pedestres, acreditamos que podemos acelerar a velocidade mantendo a precisão.

Em resumo, nosso trabalho demonstra com sucesso que o reconhecimento de pedestres em tempo real é possível em dispositivos pequenos e de baixo consumo, usando três métodos diferentes. Cada método foi adaptado pra eficiência, permitindo que funcionassem efetivamente em cenários em tempo real. À medida que avançamos, planeamos aprofundar a melhoria dessas técnicas e explorar outras formas de aumentar seu desempenho, enquanto continuamos aplicáveis a vários dispositivos móveis.

Atingindo Reconhecimento de Pedestres em Tempo Real em Dispositivos de Baixo Consumo

Este estudo apresenta métodos para reconhecimento de pedestres em tempo real usando poder de processamento limitado.

Ligações de referência

Tópicos referenciados