Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Inteligência Artificial# Aprendizagem de máquinas

Avanços nas Técnicas de Reconhecimento de Atividades Humanas

Novos métodos melhoram a precisão em reconhecer atividades humanas com dados limitados.

― 8 min ler


Métodos HAR InovadoresMétodos HAR Inovadoresrecursos limitados.reconhecimento de atividades mesmo comNovas técnicas aumentam a precisão do
Índice

Reconhecimento de Atividade Humana (HAR) é um campo que se concentra em identificar o que as pessoas estão fazendo com base em dados coletados de sensores. Essas informações podem vir de várias fontes, como smartwatches, smartphones ou outros dispositivos vestíveis que rastreiam movimento. O foco do HAR é classificar diferentes atividades, como andar, sentar ou subir escadas a partir dos dados dos sensores.

A habilidade de reconhecer atividades com precisão é importante para muitas aplicações. Isso pode variar desde a saúde, onde monitorar as atividades dos pacientes é crucial, até sistemas de rastreamento de fitness que ajudam os usuários a entenderem seus padrões de movimento. No entanto, criar sistemas HAR eficazes apresenta alguns desafios significantes.

Problema de Baixo Recurso

O primeiro desafio no HAR é o problema de baixo recurso. Isso significa que muitas vezes é difícil reunir dados rotulados suficientes para treinar modelos HAR de forma eficaz. Treinar um modelo geralmente requer uma grande quantidade de dados que foram rotulados corretamente. Por exemplo, se você quiser treinar um modelo para reconhecer sentado versus em pé, precisa de muitos exemplos de cada atividade, rotulados como tal. Coletar esses dados pode ser demorado e caro.

Em muitos cenários do mundo real, simplesmente não é prático reunir tantos dados rotulados. Por exemplo, fazer com que idosos ou crianças pequenas forneçam dados pode ser complicado devido a problemas de mobilidade ou falta de familiaridade com dispositivos. Como resultado, os dados coletados muitas vezes são insuficientes para criar modelos confiáveis.

Problema de Mudança de Distribuição

O segundo desafio é o problema de mudança de distribuição. Esse problema surge quando os dados usados para treinar um modelo não são os mesmos dados que ele encontra ao fazer previsões. Por exemplo, se um modelo é treinado com dados de jovens adultos, pode não se sair bem ao encontrar dados de adultos mais velhos. Isso acontece porque as pessoas têm diferentes formas de corpo, estilos de movimento e hábitos, o que pode afetar a forma como os dados são coletados.

Quando um modelo é treinado em um grupo e depois aplicado a outro, pode ter um desempenho ruim se não levar em conta essas diferenças. Essa variabilidade torna essencial desenvolver modelos que possam se adaptar a diferentes tipos de dados sem precisar de um retrain extensivo.

Abordagem Proposta

Para lidar com esses problemas, foi sugerida uma abordagem inovadora chamada Aprendizado de Representação Diversificado e Discriminativo. Esse método visa melhorar os modelos HAR, especialmente quando há dados de treinamento limitados disponíveis e quando pode haver diferentes distribuições entre os dados de treinamento e teste.

Principais Componentes da Abordagem

Essa nova abordagem tem três componentes principais que trabalham juntos:

  1. Geração de Diversidade: Essa etapa foca em criar mais variação nos dados. Usando uma variedade de técnicas para alterar dados existentes, mais exemplos de atividades podem ser gerados. Isso ajuda a tornar o modelo mais robusto, ensinando-o a reconhecer diferentes versões da mesma atividade.

  2. Preservação da Diversidade: Assim que dados diversos são criados, é essencial manter essa diversidade ao treinar o modelo. Isso significa garantir que as características dos novos dados não se misturem muito com os dados originais. Ao manter uma distinção entre os dados originais e os dados aumentados, o sistema pode aprender a reconhecer uma gama mais ampla de movimentos.

  3. Aprimoramento da Discriminação: Por fim, esse componente foca em melhorar a habilidade do modelo de diferenciar entre diferentes atividades. O objetivo aqui é garantir que as atividades de diferentes classes (como andar e sentar) estejam claramente separadas em termos das características que o modelo aprende. Isso é feito usando técnicas que aumentam a separação entre classes enquanto mantêm atividades semelhantes mais próximas.

Como a Abordagem Funciona

O processo começa reunindo alguns dados iniciais de sensores, que podem ser bem limitados. Técnicas de aumento de dados são então aplicadas a esses dados, criando novos exemplos por meio de métodos como:

  • Rotação: Mudando o ângulo dos dados do sensor para simular como a mesma atividade pode parecer de diferentes orientações.
  • Permutação: Rearranjando segmentos dos dados para explorar como a ordem dos movimentos pode mudar a interpretação.
  • Warping Temporal: Alterando ligeiramente o tempo dos movimentos para introduzir variabilidade.
  • Escalonamento: Ajustando a intensidade dos sinais para ver como diferentes níveis de esforço afetam os dados.
  • Jitter: Adicionando ruído aleatório aos dados para simular interrupções do mundo real.

Essas transformações criam um conjunto de dados mais rico que captura as muitas maneiras em que uma única atividade pode ser realizada.

Uma vez que esses dados aumentados são produzidos, o próximo passo envolve treinar o modelo. É aqui que a preservação da diversidade entra. O modelo é treinado para reconhecer tanto os dados originais quanto suas versões aumentadas, mas é cuidado para garantir que os dois não se tornem indistinguíveis entre si.

Ao fazer isso, o modelo pode aprender com um espectro mais amplo de exemplos, levando a um desempenho melhor. Também é crucial que o modelo consiga diferenciar efetivamente entre diferentes atividades. Ao aprimorar as capacidades de discriminação, o sistema pode identificar mais precisamente quando alguém está sentado em comparação a quando está em pé, por exemplo.

Avaliação Experimental

Para avaliar a efetividade da abordagem proposta, experimentos foram realizados usando vários conjuntos de dados disponíveis publicamente. Esses conjuntos de dados contêm leituras de pessoas realizando várias atividades. O objetivo principal era avaliar o quão bem o modelo se sai quando apenas uma pequena porcentagem dos dados de treinamento está disponível.

Conjuntos de Dados Usados

Três conjuntos de dados populares foram usados:

  1. UCI Daily and Sports Data Set: Apresenta dados de múltiplos sujeitos se engajando em várias atividades usando sensores colocados em diferentes partes do corpo.
  2. PAMAP2 Physical Activity Monitoring Dataset: Coletado de sujeitos usando sensores em diferentes locais do corpo enquanto realizam várias atividades, fornecendo uma rica fonte de dados para análise.
  3. USC Human Activity Dataset: Envolve dados coletados de sujeitos usando um sensor de celular enquanto realizam diferentes atividades.

Resultados

Os experimentos mostraram que a abordagem proposta melhorou significativamente a precisão do reconhecimento de atividades, especialmente em condições de baixo recurso. O sistema demonstrou uma melhoria média de precisão de 9,5% entre os conjuntos de dados quando comparado a outros métodos existentes.

Notavelmente, em situações onde outros métodos viram a precisão diminuir devido ao desafio de cenários de baixo recurso, a abordagem proposta conseguiu manter um desempenho robusto. Essa consistência destaca que o método é bem adequado para aplicações práticas onde os dados são limitados e variados.

As descobertas também sugeriram que usar aumento de dados efetivamente leva a melhores precisões de classificação. Ao facilitar técnicas de treinamento mais robustas que acomodam mudanças de distribuição, a abordagem proposta se mostra valiosa em cenários do mundo real.

Conclusão e Trabalho Futuro

Em conclusão, a abordagem de Aprendizado de Representação Diversificado e Discriminativo oferece uma solução promissora para os desafios enfrentados no reconhecimento de atividades humanas, especificamente em condições de baixo recurso e mudança de distribuição. A metodologia combina efetivamente geração de diversidade, preservação e aprimoramento de discriminação para criar uma estrutura robusta para reconhecimento de atividades.

Olhando para o futuro, há planos para aprimorar ainda mais essa estrutura aplicando-a a áreas relacionadas, como saúde, onde entender padrões de movimento é crucial para diagnosticar condições. Além disso, a abordagem também pode ser adaptada para trabalhar com técnicas de aprendizado federado. Isso permitiria treinar modelos em conjuntos de dados distribuídos, preservando a privacidade do usuário, o que é particularmente importante em aplicações sensíveis.

À medida que a pesquisa em HAR continua a avançar, a integração de métodos que considerem limitações de recursos e variabilidade nos dados será vital para desenvolver sistemas mais precisos e confiáveis. As aplicações potenciais são vastas, e melhorar a compreensão das atividades humanas pode trazer benefícios em várias áreas, desde saúde até tecnologia de casas inteligentes.

Fonte original

Título: Generalizable Low-Resource Activity Recognition with Diverse and Discriminative Representation Learning

Resumo: Human activity recognition (HAR) is a time series classification task that focuses on identifying the motion patterns from human sensor readings. Adequate data is essential but a major bottleneck for training a generalizable HAR model, which assists customization and optimization of online web applications. However, it is costly in time and economy to collect large-scale labeled data in reality, i.e., the low-resource challenge. Meanwhile, data collected from different persons have distribution shifts due to different living habits, body shapes, age groups, etc. The low-resource and distribution shift challenges are detrimental to HAR when applying the trained model to new unseen subjects. In this paper, we propose a novel approach called Diverse and Discriminative representation Learning (DDLearn) for generalizable low-resource HAR. DDLearn simultaneously considers diversity and discrimination learning. With the constructed self-supervised learning task, DDLearn enlarges the data diversity and explores the latent activity properties. Then, we propose a diversity preservation module to preserve the diversity of learned features by enlarging the distribution divergence between the original and augmented domains. Meanwhile, DDLearn also enhances semantic discrimination by learning discriminative representations with supervised contrastive learning. Extensive experiments on three public HAR datasets demonstrate that our method significantly outperforms state-of-art methods by an average accuracy improvement of 9.5% under the low-resource distribution shift scenarios, while being a generic, explainable, and flexible framework. Code is available at: https://github.com/microsoft/robustlearn.

Autores: Xin Qin, Jindong Wang, Shuo Ma, Wang Lu, Yongchun Zhu, Xing Xie, Yiqiang Chen

Última atualização: 2023-06-08 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.04641

Fonte PDF: https://arxiv.org/pdf/2306.04641

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes