Simple Science

Scienza all'avanguardia spiegata semplicemente

# Ingegneria elettrica e scienze dei sistemi# Elaborazione del segnale# Apprendimento automatico

Migliorare il Riconoscimento delle Attività Umane con VALERIAN

VALERIAN migliora il riconoscimento delle attività umane usando tecniche di etichettatura rumorosa per applicazioni nel mondo reale.

― 5 leggere min


VALERIAN: Un NuovoVALERIAN: Un NuovoApproccio HARdelle attività umane.etichette rumorose nel riconoscimentoVALERIAN affronta in modo efficace le
Indice

Il Riconoscimento delle Attività Umane (HAR) tramite sensori indossabili è un campo in crescita. Questi sensori, come quelli degli smartphone e degli smartwatch, sono in grado di tracciare vari movimenti. Però, la maggior parte dei metodi attuali fa fatica quando si applicano a situazioni quotidiane a causa di problemi come le Etichette Rumorose.

Il Problema

Quando raccogliamo dati in ambienti controllati, spesso otteniamo etichette pulite, il che vuol dire che i dati sono marcati correttamente. Ma nella vita reale non è così. I dati reali spesso presentano errori di etichettatura perché le persone non eseguono sempre le attività come previsto. Questo rumore può provenire da diverse fonti. Per esempio, una persona potrebbe non ricordarsi di etichettare correttamente ciò che stava facendo, oppure i dati del sensore potrebbero confondersi a causa di attività che avvengono contemporaneamente.

Questa etichettatura imprecisa rende difficile ai modelli di machine learning di imparare correttamente. I metodi tradizionali che funzionano bene in ambienti controllati spesso si rompono quando affrontano dati reali.

Comprendere le Etichette Rumorose

Per apprezzare le sfide del HAR, dobbiamo capire come le etichette rumorose influenzano i dati. Le etichette rumorose si verificano quando i dati forniti ai modelli di machine learning contengono tag errati. Per esempio, se una persona cammina ma i dati sono etichettati come seduti, queste informazioni sbagliate possono ostacolare significativamente il processo di apprendimento.

Il problema principale è che la maggior parte dei modelli presume che i dati con forti segnali saranno sempre le etichette corrette. In realtà, questa assunzione può portare a scarsi risultati, specialmente quando sono coinvolti soggetti diversi. Persone diverse possono svolgere la stessa attività in modo diverso, creando ulteriori complicazioni.

Introducendo VALERIAN

Per affrontare queste sfide, presentiamo VALERIAN, un nuovo metodo progettato per lavorare con etichette rumorose nei compiti di HAR. VALERIAN si basa su tre idee principali: impara caratteristiche che rimangono costanti indipendentemente da chi indossa il sensore, utilizza tecniche per contrastare l'impatto delle etichette rumorose, e si adatta rapidamente a nuovi soggetti.

Apprendimento Auto-Supervisionato

L'apprendimento auto-supervisionato è fondamentale per rendere VALERIAN efficace. Questo metodo consente al modello di apprendere caratteristiche utili dai dati anche quando le etichette non sono fornite. Attraverso tecniche come l'augmentation dei dati-modificare i dati originali-VALERIAN può sviluppare una solida comprensione dei movimenti umani.

Apprendimento di Caratteristiche Invarianti

L'apprendimento di caratteristiche invarianti aiuta a addestrare il modello a riconoscere schemi che sono coerenti tra diversi soggetti. Concentrandosi su queste caratteristiche condivise, VALERIAN riduce il rumore creato dalle differenze individuali. Invece di trattare ogni soggetto come unico, identifica schemi più ampi che possono essere generalizzati.

Adattamento Veloce

Quando VALERIAN incontra un nuovo soggetto per la prima volta, può rapidamente ottimizzarsi usando solo una piccola quantità di dati etichettati correttamente. Questo è cruciale per applicazioni in tempo reale dove sono necessarie rapide regolazioni man mano che arrivano nuovi dati.

Valutazione di VALERIAN

Per vedere quanto bene funziona VALERIAN, sono state eseguite diverse valutazioni utilizzando vari dataset. Questi dataset includono sia ambienti controllati, dove le etichette sono note per essere accurate, sia ambienti reali più caotici, dove le etichette sono spesso errate.

Dataset Controllati

Nei laboratori controllati, i soggetti svolgono compiti specifici, e le loro azioni sono monitorate da vicino. Questa impostazione consente di raccogliere dati puliti, che servono come riferimento per metodi nuovi. VALERIAN è stato testato rispetto a diversi metodi di base per vedere quanto bene riuscisse a correggere le etichette rumorose.

I risultati hanno mostrato che VALERIAN ha superato significativamente tutti gli altri metodi. È riuscito a correggere un'ampia percentuale di errori di etichettatura, dimostrando la sua efficacia anche a livelli di rumore elevati.

Dataset del Mondo Reale

Nei dataset del mondo reale, le sfide aumentano. I soggetti potrebbero fare cose diverse allo stesso tempo, portando a un miscuglio di attività. Le etichette rumorose sono molto più prevalenti qui. VALERIAN è stato testato in queste condizioni per vedere se potesse comunque performare bene.

Nonostante il rumore, VALERIAN ha mantenuto prestazioni solide. Si è adattato con successo a nuovi soggetti e ha corretto efficacemente gli errori di etichettatura, confermando che può funzionare in modo affidabile al di fuori degli ambienti controllati.

Risultati Chiave

  1. Impatto delle Etichette Rumorose: Le etichette rumorose rappresentano una grande sfida nel HAR. Possono fuorviare i modelli e renderli meno efficaci.

  2. Importanza della Diversità dei Soggetti: Persone diverse si comportano in modo diverso, anche durante la stessa attività. Il design di VALERIAN riconosce questa diversità e la utilizza per migliorare l'apprendimento.

  3. Efficacia dell'Apprendimento Auto-Supervisionato: Questo metodo consente al modello di apprendere caratteristiche robuste dai dati grezzi, permettendo una maggiore flessibilità e adattabilità.

  4. Capacità di Adattamento: La capacità di VALERIAN di adattarsi rapidamente a nuovi soggetti lo distingue da molti metodi tradizionali, che spesso richiedono un ampio ritraining.

Conclusione

Il riconoscimento delle attività umane nel mondo reale è un compito complesso a causa della presenza di etichette rumorose e della diversità dei soggetti. VALERIAN offre una soluzione robusta che affronta questi problemi direttamente. Impara caratteristiche utili senza fare completamente affidamento su etichette accurate, si adatta rapidamente a nuovi soggetti e offre prestazioni affidabili anche in condizioni reali disordinate.

Comprendendo e affrontando le sfide poste dalle etichette rumorose, VALERIAN rappresenta un approccio promettente per far avanzare la tecnologia HAR. I suoi principi di design possono essere applicati ad altre aree del machine learning, dove esistono sfide simili, aprendo la strada a tecniche ancora più efficaci in futuro.

Fonte originale

Titolo: VALERIAN: Invariant Feature Learning for IMU Sensor-based Human Activity Recognition in the Wild

Estratto: Deep neural network models for IMU sensor-based human activity recognition (HAR) that are trained from controlled, well-curated datasets suffer from poor generalizability in practical deployments. However, data collected from naturalistic settings often contains significant label noise. In this work, we examine two in-the-wild HAR datasets and DivideMix, a state-of-the-art learning with noise labels (LNL) method to understand the extent and impacts of noisy labels in training data. Our empirical analysis reveals that the substantial domain gaps among diverse subjects cause LNL methods to violate a key underlying assumption, namely, neural networks tend to fit simpler (and thus clean) data in early training epochs. Motivated by the insights, we design VALERIAN, an invariant feature learning method for in-the-wild wearable sensor-based HAR. By training a multi-task model with separate task-specific layers for each subject, VALERIAN allows noisy labels to be dealt with individually while benefiting from shared feature representation across subjects. We evaluated VALERIAN on four datasets, two collected in a controlled environment and two in the wild.

Autori: Yujiao Hao, Boyu Wang, Rong Zheng

Ultimo aggiornamento: 2023-03-03 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2303.06048

Fonte PDF: https://arxiv.org/pdf/2303.06048

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili