Melhorando o Reconhecimento de Atividades Humanas com VALERIAN
O VALERIAN melhora o reconhecimento de atividades humanas usando técnicas de rótulos barulhentos para aplicações do mundo real.
― 6 min ler
Índice
O reconhecimento de atividades humanas (HAR) usando sensores vestíveis é uma área que tá crescendo bastante. Esses sensores, como os de smartphones e smartwatches, conseguem rastrear vários movimentos. Mas, a maioria dos métodos atuais quebra a cara quando aplicada em situações do dia a dia, por causa de desafios como rótulos imprecisos.
O Problema
Quando a gente coleta dados em ambientes controlados, normalmente os rótulos saem bem certinhos, o que significa que os dados estão marcados corretamente. Mas isso não rola na vida real. Os dados do mundo real geralmente vêm com erros de rotulagem porque as pessoas nem sempre fazem as atividades como planejado. Esse barulho pode vir de várias fontes. Por exemplo, uma pessoa pode não lembrar de rotular o que estava fazendo direito, ou os dados do sensor podem se misturar por causa de diferentes atividades acontecendo ao mesmo tempo.
Esses rótulos imprecisos dificultam o trabalho dos modelos de aprendizado de máquina. Métodos tradicionais que funcionam bem em ambientes controlados costumam falhar quando se deparam com dados do mundo real.
Entendendo os Rótulos Ruins
Pra entender os desafios do HAR, é preciso sacar como rótulos imprecisos afetam os dados. Rótulos imprecisos acontecem quando os dados que vão pros modelos de aprendizado de máquina têm etiquetas erradas. Por exemplo, se uma pessoa anda, mas os dados são rotulados como sentada, essa informação errada pode atrapalhar muito o processo de aprendizado.
O principal problema é que a maioria dos modelos assume que dados com sinais fortes vão sempre ser os rótulos corretos. Na real, essa suposição pode resultar em mau desempenho, especialmente quando tem diferentes pessoas envolvidas. Cada um pode fazer a mesma atividade de um jeito diferente, o que complica ainda mais.
Apresentando o VALERIAN
Pra enfrentar esses desafios, a gente apresenta o VALERIAN, um novo método que foi feito pra trabalhar com rótulos imprecisos nas tarefas de HAR. O VALERIAN é baseado em três ideias principais: aprende características que se mantêm consistentes independente de quem tá usando o sensor, usa técnicas pra neutralizar o impacto dos rótulos ruins e se adapta rápido a novos sujeitos.
Aprendizado Auto-Supervisionado
O aprendizado auto-supervisionado é a chave pra fazer o VALERIAN funcionar. Esse método permite que o modelo aprenda características úteis dos dados mesmo sem rótulos. Através de técnicas como aumento de dados - que é mudar a informação original - o VALERIAN consegue desenvolver uma boa compreensão dos movimentos humanos.
Aprendizado de Características Invariantes
O aprendizado de características invariantes ajuda a treinar o modelo pra reconhecer padrões que são consistentes entre diferentes sujeitos. Focando nessas características compartilhadas, o VALERIAN reduz o barulho gerado pelas diferenças individuais. Em vez de tratar cada sujeito como único, ele identifica padrões mais amplos que podem ser generalizados.
Adaptação Rápida
Quando o VALERIAN encontra um novo sujeito pela primeira vez, ele consegue se ajustar rapidamente usando só um pouco de dados rotulados corretamente. Isso é crucial pra aplicações em tempo real, onde ajustes rápidos são necessários conforme novos dados surgem.
Avaliando o VALERIAN
Pra ver como o VALERIAN se sai, várias avaliações foram feitas com diferentes conjuntos de dados. Esses conjuntos incluem ambientes controlados, onde os rótulos são conhecidos como precisos, e ambientes do mundo real mais caóticos, onde os rótulos costumam estar errados.
Conjuntos de Dados Controlados
Em laboratórios controlados, os sujeitos realizam tarefas específicas, e as ações deles são monitoradas de perto. Essa configuração permite a coleta de dados limpos, que servem como ponto de referência pra qualquer novo método. O VALERIAN foi testado contra vários métodos base pra ver como ele corrigia rótulos imprecisos.
Os resultados mostraram que o VALERIAN superou significativamente todos os outros métodos. Ele conseguiu corrigir uma grande porcentagem de erros de rotulagem, mostrando sua eficácia mesmo em altos níveis de ruído.
Conjuntos de Dados do Mundo Real
Nos conjuntos de dados do mundo real, os desafios aumentam. Os sujeitos podem estar fazendo várias coisas ao mesmo tempo, resultando em uma mistura de atividades. Rótulos imprecisos são muito mais comuns aqui. O VALERIAN foi testado nessas condições pra ver se ele ainda conseguia se sair bem.
Apesar do barulho, o VALERIAN manteve um desempenho sólido. Ele se adaptou com sucesso a novos sujeitos e corrigiu erros de rotulagem de maneira eficaz, confirmando que ele pode funcionar de forma confiável fora de ambientes controlados.
Principais Conclusões
Impacto dos Rótulos Ruins: Rótulos imprecisos são um grande desafio no HAR. Eles podem desorientar os modelos e torná-los menos eficazes.
Importância da Diversidade entre Sujeitos: Pessoas diferentes se comportam de maneira diferente, mesmo durante a mesma atividade. O design do VALERIAN reconhece essa diversidade e a usa pra melhorar o aprendizado.
Eficácia do Aprendizado Auto-Supervisionado: Esse método permite que o modelo aprenda características robustas a partir de dados brutos, permitindo maior flexibilidade e adaptabilidade.
Capacidades de Adaptação: A habilidade do VALERIAN de se adaptar rapidamente a novos sujeitos o diferencia de muitos métodos tradicionais, que muitas vezes precisam de retraining extenso.
Conclusão
Reconhecer atividades humanas no mundo real é uma tarefa complexa devido à presença de rótulos imprecisos e à diversidade dos sujeitos. O VALERIAN oferece uma solução robusta que enfrenta esses problemas de frente. Ele aprende características úteis sem depender completamente de rótulos precisos, se adapta rapidamente a novos sujeitos e proporciona um desempenho confiável mesmo em condições bagunçadas do mundo real.
Ao entender e abordar os desafios dos rótulos imprecisos, o VALERIAN se destaca como uma abordagem promissora pra avançar a tecnologia de HAR. Seus princípios de design podem ser aplicados a outras áreas de aprendizado de máquina, onde desafios semelhantes existem, abrindo caminho pra técnicas ainda mais eficazes no futuro.
Título: VALERIAN: Invariant Feature Learning for IMU Sensor-based Human Activity Recognition in the Wild
Resumo: Deep neural network models for IMU sensor-based human activity recognition (HAR) that are trained from controlled, well-curated datasets suffer from poor generalizability in practical deployments. However, data collected from naturalistic settings often contains significant label noise. In this work, we examine two in-the-wild HAR datasets and DivideMix, a state-of-the-art learning with noise labels (LNL) method to understand the extent and impacts of noisy labels in training data. Our empirical analysis reveals that the substantial domain gaps among diverse subjects cause LNL methods to violate a key underlying assumption, namely, neural networks tend to fit simpler (and thus clean) data in early training epochs. Motivated by the insights, we design VALERIAN, an invariant feature learning method for in-the-wild wearable sensor-based HAR. By training a multi-task model with separate task-specific layers for each subject, VALERIAN allows noisy labels to be dealt with individually while benefiting from shared feature representation across subjects. We evaluated VALERIAN on four datasets, two collected in a controlled environment and two in the wild.
Autores: Yujiao Hao, Boyu Wang, Rong Zheng
Última atualização: 2023-03-03 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2303.06048
Fonte PDF: https://arxiv.org/pdf/2303.06048
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.