Avançando o Reconhecimento de Atividades Humanas com a Estrutura DHC-HGL
Uma nova abordagem pra melhorar o reconhecimento de atividades humanas usando contextos de dados diversos.
Wen Ge, Guanyi Mou, Emmanuel O. Agu, Kyumin Lee
― 8 min ler
Índice
- O Desafio do Reconhecimento de Atividades Humanas
- Reconhecimento de Atividades Humanas com Contexto
- Métodos Existentes para CA-HAR
- Nossa Abordagem: DHC-HGL
- Avaliação do DHC-HGL
- Aplicação no Mundo Real: Coletando Dados
- Abordando os Desafios da Qualidade dos Dados
- A Importância da Diversidade de Bordas e Nós
- Aprendendo Representações
- Métricas de Desempenho
- Resultados e Descobertas
- Analisando Representações de Nós
- Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
Reconhecer atividades humanas usando dados de sensores é conhecido como Reconhecimento de Atividades Humanas (HAR). Essa tarefa é bem importante, especialmente em sistemas que se adaptam aos contextos dos usuários, tipo smartphones. HAR pode ser complicado porque várias atividades podem rolar ao mesmo tempo, e os dados dos sensores podem ser inconsistentes dependendo de vários fatores, como a forma e o lugar que um dispositivo é segurado. Esse artigo fala sobre uma nova estrutura chamada Deep Heterogeneous Contrastive Hyper-Graph Learning (DHC-HGL), que tem como objetivo melhorar o reconhecimento de atividades humanas levando em conta contextos variados.
O Desafio do Reconhecimento de Atividades Humanas
O Reconhecimento de Atividades Humanas envolve classificar dados de sensores acoplados a pessoas, como acelerômetros que a gente encontra em smartphones. Esses sistemas têm várias aplicações no mundo real, desde monitoramento de saúde até integração em casas inteligentes. Com a popularização dos dispositivos inteligentes, tem uma tonelada de dados disponíveis para essas atividades, mas ainda existem vários desafios.
As atividades costumam se sobrepor; por exemplo, alguém pode estar sentado enquanto fala ao telefone. Às vezes, alguns dados podem estar faltando, o que complica ainda mais a tarefa. Diferentes maneiras de usar ou posicionar o dispositivo por diferentes pessoas também podem levar a leituras de sensores variadas para a mesma atividade. Diante dessas questões, os avanços recentes se concentram em incorporar o contexto desses sinais de sensores e do usuário no processo de reconhecimento.
Reconhecimento de Atividades Humanas com Contexto
O Reconhecimento de Atividades Humanas com Contexto (CA-HAR) visa melhorar o HAR considerando tanto a atividade que está sendo realizada quanto o contexto em que acontece. Para isso, um modelo recebe dados dos sensores e tenta adivinhar qual atividade está rolando e o contexto, como a forma que o smartphone está sendo segurado ou o ambiente ao redor.
Uma tarefa CA-HAR envolve três elementos principais: usuários, atividades e o contexto em que a atividade acontece. Por exemplo, se alguém está digitando no celular enquanto está sentado, essa interação é registrada como um conjunto de conexões entre esses elementos.
Métodos Existentes para CA-HAR
Atualmente, existem vários métodos para CA-HAR, que podem ser amplamente categorizados em três tipos:
-
Métodos não gráficos: Essas abordagens usam técnicas tradicionais de machine learning, dependendo da extração manual de características. Elas não criam representações gráficas dos dados, o que pode deixar de lado as interconexões entre diferentes entidades.
-
Métodos de gráfico dependentes de características: Esses métodos criam gráficos com base em características específicas, como a localização do usuário. Embora possam melhorar os resultados, eles exigem informações sensíveis, como dados de GPS, que muitos usuários não estão dispostos a fornecer.
-
Métodos de gráfico independentes de características: Diferente da categoria anterior, esses métodos não se baseiam em características de dados específicas. Em vez disso, eles focam em conexões gerais entre usuários, contextos e atividades, permitindo uma aplicação mais ampla sem precisar de dados sensíveis.
Apesar desses avanços, muitos métodos ainda se concentram em conexões rasas, não conseguem capturar a diversidade nas bordas ou ignoram dados faltantes.
Nossa Abordagem: DHC-HGL
Para superar esses problemas, propomos a estrutura Deep Heterogeneous Contrastive Hyper-Graph Learning. Nossa abordagem envolve dois aspectos principais:
-
Diversidade de Nós e Bordas: Usando uma estrutura de hipergrafo, que permite que mais de dois nós se conectem, conseguimos capturar relações complexas. Cada nó pode representar um usuário, atividade ou contexto, permitindo um aprendizado mais profundo.
-
Perda Contrastiva: Essa é uma técnica que ajuda a garantir que nós semelhantes (ex: usuários em contextos parecidos) fiquem agrupados próximos, enquanto os diferentes fiquem distantes. Isso ajuda a conseguir uma melhor consistência na representação dos nós.
Avaliação do DHC-HGL
Testamos nossa estrutura extensivamente usando dois conjuntos de dados do mundo real. Os resultados mostram que o DHC-HGL alcança um desempenho muito melhor comparado a modelos existentes no reconhecimento de atividades. A estrutura se destacou em diferenciar usuários, contextos e atividades, melhorando assim as taxas de reconhecimento em vários cenários.
Aplicação no Mundo Real: Coletando Dados
Os conjuntos de dados usados para avaliação envolveram participantes que coletaram dados de sensores enquanto viviam seu dia a dia. Esses ambientes não roteirizados levaram a dados ricos e variados, tornando-os ideais para testar a eficácia do nosso modelo proposto. O smartphone de cada participante coletou dados, incluindo leituras de acelerômetro, giroscópio e magnetômetro, que foram rotulados com base nos contextos e atividades fornecidos pelos usuários.
Abordando os Desafios da Qualidade dos Dados
Enquanto trabalhávamos com dados do mundo real, encontramos problemas como rótulos conflitantes. Por exemplo, um usuário pode fornecer múltiplos posicionamentos para seu telefone, que são logicamente impossíveis. Portanto, tivemos que resolver esses conflitos cuidadosamente para garantir que a qualidade dos dados permanecesse alta.
Além disso, nem todos os sensores estavam ativos para cada participante, levando a pontos de dados faltantes. Usamos métodos rigorosos de pré-processamento para lidar com essas lacunas, garantindo que nosso modelo ainda funcionasse de forma confiável.
A Importância da Diversidade de Bordas e Nós
Um dos aspectos inovadores da nossa abordagem está em como lidamos com as relações entre os nós. Ao distinguir entre vários tipos de conexões, podemos criar uma representação mais detalhada das relações entre usuários, contextos e atividades.
A diversidade de bordas leva em conta as diferentes maneiras que os nós podem interagir. Por exemplo, uma conexão pode envolver um usuário e seu contexto sem incluir uma atividade, ou pode representar um usuário e uma atividade sem contexto. Reconhecendo essas variações, conseguimos aprimorar o processo de aprendizado da nossa estrutura.
Aprendendo Representações
O modelo usa uma abordagem de aprendizado baseada em gráficos, onde a representação inicial de cada nó é derivada da média das instâncias conectadas a ele. À medida que o processo de aprendizado avança, essas representações evoluem, permitindo uma melhor compreensão e classificação das atividades.
Métricas de Desempenho
Para avaliar a eficácia do DHC-HGL, usamos várias métricas de desempenho, incluindo o Coeficiente de Correlação de Matthews (MCC) e a Macro F1 Score. Ambas as métricas fornecem uma visão robusta de como o modelo se sai em diferentes condições, especialmente em conjuntos de dados desbalanceados.
Resultados e Descobertas
Os resultados de nossos experimentos indicam que o DHC-HGL supera modelos existentes, especialmente no reconhecimento de atividades. Por exemplo, mostrou consistentemente melhor precisão em ambos os conjuntos de dados em comparação com modelos de base.
Em termos de reconhecimento de atividades específicas, as melhorias variaram significativamente, mostrando a flexibilidade e eficácia da estrutura em condições do mundo real variadas.
Analisando Representações de Nós
Nós também realizamos uma análise das representações de nós aprendidas. Usando técnicas visuais, descobrimos que nosso modelo pode diferenciar efetivamente entre vários nós (ex: usuários, contextos, atividades) de maneira significativa. Essa propriedade melhora a interpretabilidade das decisões do modelo.
Direções Futuras
Seguindo em frente, há inúmeras possibilidades para aprimorar nossa abordagem. Queremos testar o DHC-HGL com diferentes backbones de redes neurais para verificar sua versatilidade além das redes de convolução de hipergrafo. Além disso, explorar métodos alternativos para agregar dados dentro do hipergrafo pode resultar em resultados ainda melhores.
Além disso, enquanto nossa definição atual de contexto gira em torno da colocação do dispositivo, trabalhos futuros podem considerar a inclusão de mais fatores, como a identidade do usuário, para refinar ainda mais o processo de reconhecimento.
Conclusão
No geral, o DHC-HGL representa um avanço significativo no campo do reconhecimento de atividades humanas com contexto. Ao lidar tanto com a diversidade de bordas quanto de nós, conseguimos criar um modelo robusto que alcança excelente precisão de reconhecimento em conjuntos de dados variados. Este trabalho abre caminho para pesquisas futuras em sistemas mais personalizados e adaptativos que possam entender e responder melhor às atividades dos usuários em tempo real.
As possíveis aplicações dessa estrutura vão além do HAR; ela também pode beneficiar outros domínios que requerem análise ciente do contexto, como monitoramento de saúde ou gerenciamento de ambientes inteligentes. À medida que a tecnologia continua a evoluir, também cresce a necessidade de sistemas que possam interpretar inteligentemente o comportamento humano, tornando nossa pesquisa cada vez mais relevante.
Título: Deep Heterogeneous Contrastive Hyper-Graph Learning for In-the-Wild Context-Aware Human Activity Recognition
Resumo: Human Activity Recognition (HAR) is a challenging, multi-label classification problem as activities may co-occur and sensor signals corresponding to the same activity may vary in different contexts (e.g., different device placements). This paper proposes a Deep Heterogeneous Contrastive Hyper-Graph Learning (DHC-HGL) framework that captures heterogenous Context-Aware HAR (CA-HAR) hypergraph properties in a message-passing and neighborhood-aggregation fashion. Prior work only explored homogeneous or shallow-node-heterogeneous graphs. DHC-HGL handles heterogeneous CA-HAR data by innovatively 1) Constructing three different types of sub-hypergraphs that are each passed through different custom HyperGraph Convolution (HGC) layers designed to handle edge-heterogeneity and 2) Adopting a contrastive loss function to ensure node-heterogeneity. In rigorous evaluation on two CA-HAR datasets, DHC-HGL significantly outperformed state-of-the-art baselines by 5.8% to 16.7% on Matthews Correlation Coefficient (MCC) and 3.0% to 8.4% on Macro F1 scores. UMAP visualizations of learned CA-HAR node embeddings are also presented to enhance model explainability.
Autores: Wen Ge, Guanyi Mou, Emmanuel O. Agu, Kyumin Lee
Última atualização: 2024-09-27 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2409.18481
Fonte PDF: https://arxiv.org/pdf/2409.18481
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.