Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli# Intelligenza artificiale# Apprendimento automatico

Progressi nelle Tecniche di Riconoscimento delle Attività Umane

Nuovi metodi migliorano l'accuratezza nel riconoscere le attività umane con dati limitati.

― 7 leggere min


Metodi HAR innovativiMetodi HAR innovativicon risorse limitate.del riconoscimento delle attività ancheNuove tecniche aumentano l'accuratezza
Indice

Il riconoscimento delle attività umane (HAR) è un campo che si concentra sull'identificazione di ciò che le persone stanno facendo in base ai dati raccolti da sensori. Queste informazioni possono provenire da varie fonti, come smartwatch, smartphone o altri dispositivi indossabili che monitorano il movimento. Il cuore del HAR è classificare diverse attività come camminare, sedere o salire le scale dai dati dei sensori.

Essere in grado di riconoscere le attività in modo accurato è importante per molte applicazioni. Queste possono variare dall’assistenza sanitaria, dove monitorare le attività dei pazienti è fondamentale, ai sistemi di tracciamento fitness che aiutano gli utenti a capire i loro schemi di movimento. Tuttavia, creare sistemi HAR efficaci presenta un paio di sfide significative.

Problema delle Risorse Limitate

La prima sfida nel HAR è il problema delle risorse limitate. Questo significa che è spesso difficile raccogliere abbastanza dati etichettati per addestrare i modelli HAR in modo efficace. Addestrare un modello di solito richiede una grande quantità di dati etichettati correttamente. Ad esempio, se vuoi addestrare un modello per riconoscere seduto contro in piedi, hai bisogno di molti esempi di ciascuna attività, etichettati come tali. Raccogliere questi dati può essere dispendioso in termini di tempo e costoso.

In molte situazioni del mondo reale, non è semplicemente pratico raccogliere così tanti dati etichettati. Ad esempio, ottenere dati da persone anziane o bambini piccoli può essere difficile a causa di problemi di mobilità o della loro mancanza di familiarità con i dispositivi. Di conseguenza, i dati raccolti sono spesso insufficienti per creare modelli affidabili.

Problema del Cambio di Distribuzione

La seconda sfida è il problema del cambio di distribuzione. Questo problema si verifica quando i dati utilizzati per addestrare un modello non sono gli stessi di quelli con cui si confronta quando fa previsioni. Ad esempio, se un modello è addestrato su dati di giovani adulti, potrebbe non funzionare bene quando incontra dati di adulti più anziani. Questo succede perché le persone hanno forme del corpo, stili di movimento e abitudini diverse, il che può influenzare come vengono raccolti i dati.

Quando un modello è addestrato su un gruppo e poi applicato a un altro, potrebbe performare male se non tiene conto di queste differenze. Questa variabilità rende essenziale sviluppare modelli che possano adattarsi a diversi tipi di dati senza necessitare di un ritraining esteso.

Approccio Proposto

Per affrontare questi problemi, è stato suggerito un approccio innovativo chiamato Apprendimento di Rappresentazione Diversificata e Discriminativa. Questo metodo mira a migliorare i modelli HAR, specialmente quando ci sono dati di addestramento limitati e quando potrebbero esserci distribuzioni diverse tra i dati di addestramento e quelli di test.

Componenti Chiave dell'Approccio

Questo nuovo approccio ha tre principali componenti che lavorano insieme:

  1. Generazione di Diversità: Questo passo si concentra sulla creazione di più variazioni nei dati. Utilizzando una varietà di tecniche per modificare i dati esistenti, possono essere generate più esempi di attività. Questo aiuta a rendere il modello più robusto insegnandogli a riconoscere diverse versioni della stessa attività.

  2. Preservazione della Diversità: Una volta creati i dati diversificati, è essenziale mantenere questa diversità durante l'addestramento del modello. Questo significa assicurarsi che le caratteristiche dei nuovi dati non si mescolino troppo con i dati originali. Mantenendo una distinzione tra i dati originali e quelli aumentati, il sistema può imparare a riconoscere un'ampia gamma di movimenti.

  3. Miglioramento della Discriminazione: Infine, questo componente si concentra sul migliorare la capacità del modello di differenziare tra diverse attività. L'obiettivo qui è assicurarsi che le attività provenienti da diverse classi (come camminare e sedere) siano chiaramente separate in termini delle caratteristiche che il modello apprende. Questo viene fatto utilizzando tecniche che migliorano la separazione tra le classi mantenendo attività simili più vicine tra loro.

Come Funziona l'Approccio

Il processo inizia raccogliendo alcuni dati iniziali dai sensori, che possono essere piuttosto limitati. Le tecniche di aumento dei dati vengono poi applicate a questi dati, creando nuovi esempi utilizzando metodi come:

  • Rotazione: Cambiando l'angolo dei dati dei sensori per simulare come potrebbe apparire la stessa attività da diverse angolazioni.
  • Permutazione: Riordinando segmenti dei dati per esplorare come l'ordine dei movimenti può cambiare l'interpretazione.
  • Time-Warping: Alterando leggermente il timing dei movimenti per introdurre variabilità.
  • Scaling: Regolando l'intensità dei segnali per vedere come diversi livelli di sforzo influenzano i dati.
  • Jittering: Aggiungendo rumore casuale ai dati per simulare interruzioni nel mondo reale.

Queste trasformazioni creano un dataset più ricco che cattura i molti modi in cui può essere eseguita una singola attività.

Una volta prodotto questo dato aumentato, il passo successivo comporta l'addestramento del modello. Qui entra in gioco la preservazione della diversità. Il modello viene addestrato a riconoscere sia i dati originali che le sue versioni aumentate, ma si fa attenzione a garantire che i due non diventino troppo indistinguibili l'uno dall'altro.

Facendo questo, il modello può apprendere da uno spettro più ampio di esempi, portando a una performance migliore. È anche cruciale per il modello distinguere in modo efficace tra diverse attività. Migliorando le capacità discriminative, il sistema può identificare più accuratamente quando qualcuno sta seduto rispetto a quando è in piedi, ad esempio.

Valutazione Sperimentale

Per valutare l'efficacia dell'approccio proposto, sono stati condotti esperimenti utilizzando diversi dataset disponibili pubblicamente. Questi dataset contengono letture di persone che svolgono varie attività. L'obiettivo principale era valutare quanto bene performa il modello quando è disponibile solo una piccola percentuale dei dati di addestramento.

Dataset Utilizzati

Tre dataset popolari sono stati utilizzati principalmente:

  1. UCI Daily and Sports Data Set: Contiene dati di più soggetti che si impegnano in varie attività utilizzando sensori posizionati su diverse parti del corpo.
  2. PAMAP2 Physical Activity Monitoring Dataset: Raccolto da soggetti che indossano sensori in diverse posizioni del corpo mentre svolgono diverse attività, fornendo una ricca fonte di dati per l'analisi.
  3. USC Human Activity Dataset: Coinvolge dati raccolti da soggetti che utilizzano un sensore di telefono mobile mentre svolgono diverse attività.

Risultati

Gli esperimenti hanno mostrato che l'approccio proposto ha migliorato significativamente l'accuratezza del riconoscimento delle attività, soprattutto in condizioni di risorse limitate. Il sistema ha dimostrato un miglioramento medio dell'accuratezza del 9,5% su tutti i dataset rispetto ad altri metodi esistenti.

Notavelmente, in situazioni dove altri metodi hanno visto un calo di accuratezza a causa della sfida delle risorse limitate, l'approccio proposto è riuscito a mantenere prestazioni robuste. Questa coerenza evidenzia che il metodo è ben adatto per applicazioni pratiche dove i dati sono limitati e variabili.

I risultati hanno anche suggerito che utilizzare efficacemente l'aumento dei dati porta a migliori accuracies di classificazione. Facilitando tecniche di addestramento più robuste che accolgono i cambiamenti di distribuzione, l'approccio proposto si dimostra prezioso in scenari del mondo reale.

Conclusione e Lavori Futuri

In conclusione, l'approccio di Apprendimento di Rappresentazione Diversificata e Discriminativa offre una soluzione promettente alle sfide affrontate nel riconoscimento delle attività umane, specificamente in condizioni di risorse limitate e cambio di distribuzione. La metodologia combina efficacemente generazione di diversità, preservazione e miglioramento della discriminazione per creare un framework robusto per il riconoscimento delle attività.

Guardando avanti, ci sono piani per migliorare ulteriormente questo framework applicandolo a settori correlati, come l’assistenza sanitaria, dove comprendere i modelli di movimento è cruciale per diagnosticare condizioni. Inoltre, l'approccio potrebbe essere adattato per lavorare con tecniche di apprendimento federato. Questo consentirebbe di addestrare modelli su dataset distribuiti preservando la privacy degli utenti, che è particolarmente importante in applicazioni sensibili.

Man mano che la ricerca nel HAR continua ad avanzare, l'integrazione di metodi che tengono conto delle limitazioni delle risorse e della variabilità nei dati sarà fondamentale per sviluppare sistemi più accurati e affidabili. Le potenziali applicazioni sono vaste e migliorare la comprensione delle attività umane può portare a benefici in vari campi, dalla sanità alla tecnologia delle case intelligenti.

Fonte originale

Titolo: Generalizable Low-Resource Activity Recognition with Diverse and Discriminative Representation Learning

Estratto: Human activity recognition (HAR) is a time series classification task that focuses on identifying the motion patterns from human sensor readings. Adequate data is essential but a major bottleneck for training a generalizable HAR model, which assists customization and optimization of online web applications. However, it is costly in time and economy to collect large-scale labeled data in reality, i.e., the low-resource challenge. Meanwhile, data collected from different persons have distribution shifts due to different living habits, body shapes, age groups, etc. The low-resource and distribution shift challenges are detrimental to HAR when applying the trained model to new unseen subjects. In this paper, we propose a novel approach called Diverse and Discriminative representation Learning (DDLearn) for generalizable low-resource HAR. DDLearn simultaneously considers diversity and discrimination learning. With the constructed self-supervised learning task, DDLearn enlarges the data diversity and explores the latent activity properties. Then, we propose a diversity preservation module to preserve the diversity of learned features by enlarging the distribution divergence between the original and augmented domains. Meanwhile, DDLearn also enhances semantic discrimination by learning discriminative representations with supervised contrastive learning. Extensive experiments on three public HAR datasets demonstrate that our method significantly outperforms state-of-art methods by an average accuracy improvement of 9.5% under the low-resource distribution shift scenarios, while being a generic, explainable, and flexible framework. Code is available at: https://github.com/microsoft/robustlearn.

Autori: Xin Qin, Jindong Wang, Shuo Ma, Wang Lu, Yongchun Zhu, Xing Xie, Yiqiang Chen

Ultimo aggiornamento: 2023-06-08 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2306.04641

Fonte PDF: https://arxiv.org/pdf/2306.04641

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili