Sistema de Monitoramento de EPI Inteligente Aumenta a Segurança dos Trabalhadores
Um novo sistema usa análise de vídeo pra melhorar a conformidade com as regras de EPI.
Surya N Reddy, Vaibhav Kurrey, Mayank Nagar, Gagan Raj Gupta
― 8 min ler
Índice
Em grandes indústrias, a segurança dos trabalhadores é uma preocupação top, especialmente quando se trata de usar Equipamentos de Proteção Individual (EPIs) como capacetes, luvas e óculos de segurança. Como você pode imaginar, trabalhar com máquinas pesadas sem o equipamento certo pode dar muito errado. Para resolver esse problema, pesquisadores desenvolveram um sistema único que usa análise de vídeo pra detectar se os trabalhadores estão usando o EPI certo baseado no que eles estão fazendo. E, num mundo onde a gente costuma perder as chaves, saber o que alguém tá fazendo pode ajudar a lembrar a pessoa de usar o equipamento de segurança.
O Problema com a Conformidade no Uso de EPIs
Embora existam regulamentos pra garantir que os trabalhadores usem os EPIs apropriados, seguir essas normas pode ser difícil. É especialmente desafiador quando muitos funcionários estão trabalhando ao mesmo tempo. Imagine um canteiro de obras movimentado: gente se mexendo, máquinas rugindo e um agente de segurança tentando acompanhar quem tá usando o quê. Parece mais um jogo de "Onde está o Wally?" do que uma gestão de segurança eficaz. O principal problema é que os métodos de monitoramento tradicionais geram muitos alarmes falsos. Se um trabalhador não tá seguindo as regras de EPI, pode ser complicado entender o porquê. Ele tá usando o equipamento certo pro que tá fazendo? Ou tá fazendo algo perigoso?
Desafios de Monitoramento
A vigilância por vídeo pode parecer uma solução perfeita pra monitorar a conformidade com as regras de EPI. Porém, não é só apontar uma câmera e chamar de dia. Pra começar, muitos sistemas de vigilância não têm a capacidade de se adaptar às diferentes ações que os trabalhadores estão realizando. Alguns trabalhadores podem precisar só de capacete e botas, enquanto outros podem precisar de luvas e óculos também. Imagine uma câmera tentando categorizar cada ação enquanto dezenas de trabalhadores estão se movendo como se fosse uma dança coreografada.
Pra enfrentar esse desafio, pesquisadores propuseram um sistema que combina reconhecimento de atividades com técnicas de Detecção de Objetos. Em termos mais simples, isso significa ensinar o computador não só a ver o EPI, mas também a entender quais ações os trabalhadores estão fazendo e qual equipamento de segurança eles deveriam estar usando.
A Tecnologia por Trás da Solução
Pra construir esse sistema de monitoramento inteligente, os pesquisadores criaram um conjunto de dados recheado de vídeos de pessoas realizando várias ações industriais. O conjunto de dados foi cuidadosamente montado a partir de ambientes de fabricação do mundo real pra refletir as complexidades que você pode encontrar num chão de fábrica agitado. Esses vídeos foram segmentados em clipes menores pra facilitar a análise do que tava acontecendo. Pense nisso como um reality show, mas em vez de ver as vidas das pessoas se desenrolando, estamos vendo elas levantando, carregando e soldando de forma segura e responsável.
Os pesquisadores usaram uma rede SlowFast pra reconhecimento de ações. Esse modelo poderoso processa vídeos de duas maneiras: devagar, pra captar os detalhes intrincados do que tá acontecendo, e rápido, pra ver movimentos rápidos. Imagine um recurso de zoom out e zoom in juntos: ele consegue captar o panorama geral e os pequenos detalhes ao mesmo tempo. O modelo de reconhecimento de ações trabalha em conjunto com um modelo de detecção de objetos chamado YOLOv9 pra descobrir não só quais ações estão acontecendo, mas também se os trabalhadores estão usando o EPI correto pra essas ações.
Coleta e Preparação de Dados
Criar esse conjunto de dados não foi tão fácil quanto parece. Os pesquisadores coletaram horas de filmagens de câmeras de vigilância em instalações de fabricação. Depois, passaram horas segmentando os vídeos em clipes de 15 segundos, removendo aqueles que não atendiam a certos padrões de qualidade visual. Basicamente, é como peneirar uma montanha de gravações pra achar aqueles momentos valiosos em que um trabalhador realmente fez o trabalho certo.
Depois de reunir uma boa coleção de clipes, era hora de rotular as ações. Esse processo envolveu um grupo de anotadores humanos que assistiram os vídeos, identificaram as ações que estavam sendo realizadas e anotaram quais EPIs eram necessários pra aquelas atividades. Essa tarefa trabalhosa garantiu que o sistema teria uma compreensão sólida da relação entre ações e necessidades de EPI.
Reconhecimento de Ações e Detecção de EPIs
Agora que os pesquisadores tinham um conjunto de dados funcional, treinavam seu modelo de reconhecimento de ações. Esse modelo aprendeu a ver e categorizar várias ações como soldar, carregar materiais ou simplesmente andar. Na mesma onda, eles ensinaram o modelo YOLOv9 a identificar se os trabalhadores estavam usando o EPI certo.
Imagine treinar um cachorro pra buscar—no começo, ele pode não entender o que você quer. Mas com orientação consistente, ele aprende que "buscar" significa trazer a bola de volta. Neste caso, o computador aprendeu a reconhecer ações e EPIs usando vídeos como seu campo de treinamento.
A combinação desses dois modelos resulta num sistema que pode identificar o que os trabalhadores estão fazendo e verificar se eles estão usando o EPI apropriado. Nada de alarmes falsos! Se um trabalhador tá soldando, por exemplo, e não tá usando um capacete de soldagem, o sistema vai sinalizar isso como uma violação de segurança.
Resultados e Observações
Depois de treinar o modelo, os pesquisadores compararam seu desempenho com os sistemas existentes que só dependiam da detecção de EPIs. Acontece que a nova integração de reconhecimento de atividades e detecção de objetos foi revolucionária. O sistema mostrou uma melhoria notável na precisão, com uma porcentagem maior de violações de EPI identificadas corretamente em comparação com métodos tradicionais.
Eles também fizeram um estudo onde agentes de segurança humanos revisaram vídeos juntamente com as descobertas do sistema de aprendizado de máquina. Enquanto os avaliadores humanos conseguiram identificar a maioria das violações, o sistema automatizado teve melhor precisão e taxa de retorno. Em termos simples, as máquinas estavam pegando violações que os humanos às vezes deixavam passar.
Vantagens do Novo Sistema
O novo sistema promete várias vantagens:
-
Redução de Alarmes Falsos: Ao entender as ações que os trabalhadores estão realizando, o sistema diminui o número de alertas desnecessários sobre EPIs.
-
Altas Taxas de Retorno: O sistema pode identificar com precisão os incidentes quando o EPI tá faltando, ajudando a aumentar a segurança no local.
-
Eficiência: A natureza automatizada do sistema libera o tempo dos agentes de segurança pra que eles possam se concentrar em outras tarefas importantes, em vez de ficar monitorando os vídeos o tempo todo.
-
Monitoramento em tempo real: O sistema pode processar os feeds de vídeo em tempo real, permitindo alertas imediatos quando violações são detectadas.
-
Conjunto de Dados Abrangente: O esforço meticuloso na criação desse conjunto de dados significa que ele reflete a natureza caótica dos ambientes industriais do mundo real, tornando o desempenho do sistema mais confiável.
Desafios à Frente
Embora os pesquisadores tenham feito grandes avanços, ainda existem desafios pela frente. Por um lado, o conjunto de dados só inclui feeds de vídeo 2D. Adicionar percepção de profundidade poderia melhorar a capacidade do modelo de avaliar a segurança dos trabalhadores em certos cenários. É uma coisa ver alguém embaixo de um guindaste; é outra saber quão longe eles deveriam estar. Esses detalhes podem ser cruciais pra uma segurança aprimorada.
O campo de visão das câmeras também é uma preocupação. Muitas câmeras estão configuradas pra cobrir a área máxima, dificultando a identificação de itens pequenos como luvas ou óculos de segurança. Aumentar o número de câmeras poderia resolver esse problema, mas isso também levanta questões sobre custo e viabilidade em grandes indústrias.
Conclusão
Em resumo, a integração do reconhecimento de atividades e detecção de EPIs representa um avanço significativo na tecnologia de segurança no trabalho. Ao entender o que os trabalhadores estão fazendo e garantir que eles estejam usando o equipamento de segurança apropriado, esse sistema tem o potencial de salvar vidas. Num mundo onde as regulamentações de segurança às vezes parecem uma batalha difícil, essa solução inteligente poderia ser exatamente o que precisamos pra garantir a conformidade e proteger os trabalhadores.
Agora, toda vez que você ouvir falar de robôs assumindo empregos, apenas lembre-se: eles podem ser os que te lembram de usar o capacete de segurança enquanto você tá levantando objetos pesados. Segurança em primeiro lugar, e com esse sistema esperto, pode ser muito mais fácil ficar de olho nisso!
Fonte original
Título: Action Recognition based Industrial Safety Violation Detection
Resumo: Proper use of personal protective equipment (PPE) can save the lives of industry workers and it is a widely used application of computer vision in the large manufacturing industries. However, most of the applications deployed generate a lot of false alarms (violations) because they tend to generalize the requirements of PPE across the industry and tasks. The key to resolving this issue is to understand the action being performed by the worker and customize the inference for the specific PPE requirements of that action. In this paper, we propose a system that employs activity recognition models to first understand the action being performed and then use object detection techniques to check for violations. This leads to a 23% improvement in the F1-score compared to the PPE-based approach on our test dataset of 109 videos.
Autores: Surya N Reddy, Vaibhav Kurrey, Mayank Nagar, Gagan Raj Gupta
Última atualização: 2024-12-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.05531
Fonte PDF: https://arxiv.org/pdf/2412.05531
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.