Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Elektrotechnik und Systemtechnik# Signalverarbeitung# Maschinelles Lernen

Verbesserung der menschlichen Aktivitätserkennung mit VALERIAN

VALERIAN verbessert die Erkennung menschlicher Aktivitäten mit Methoden für rauschende Labels für reale Anwendungen.

― 5 min Lesedauer


VALERIAN: Ein neuerVALERIAN: Ein neuerHAR-AnsatzAktivitäten um.Labels bei der Erkennung menschlicherVALERIAN geht effektiv mit lauten
Inhaltsverzeichnis

Die Erkennung menschlicher Aktivitäten (HAR) mit tragbaren Sensoren ist ein zunehmend interessantes Thema. Diese Sensoren, wie die in Smartphones und Smartwatches, können verschiedene Bewegungen verfolgen. Allerdings haben die meisten aktuellen Methoden Schwierigkeiten, wenn sie im Alltag angewendet werden, aufgrund von Herausforderungen wie rauen Labels.

Das Problem

Wenn wir Daten in kontrollierten Umgebungen sammeln, führt das oft zu sauberen Labels, was bedeutet, dass die Daten genau gekennzeichnet sind. Im echten Leben ist das jedoch nicht der Fall. Daten aus der realen Welt kommen oft mit Fehlern in der Kennzeichnung, weil Leute nicht immer die Aktivitäten so durchführen, wie geplant. Dieses Rauschen kann aus verschiedenen Quellen stammen. Zum Beispiel könnte eine Person vergessen, korrekt zu kennzeichnen, was sie gemacht hat, oder die Sensordaten könnten durcheinander geraten, wenn mehrere Aktivitäten gleichzeitig stattfinden.

Diese ungenauen Labels machen es schwierig für maschinelle Lernmodelle, richtig zu lernen. Traditionelle Methoden, die in kontrollierten Umgebungen gut funktionieren, scheitern oft, wenn sie mit echten Daten konfrontiert werden.

Verständnis von Rausch-Labels

Um die Herausforderungen von HAR zu verstehen, müssen wir wissen, wie rauschende Labels die Daten beeinflussen. Rausch-Labels entstehen, wenn die Daten, die maschinellen Lernmodellen gegeben werden, falsche Tags enthalten. Wenn zum Beispiel eine Person geht, aber die Daten als Sitzen gekennzeichnet sind, kann diese falsche Information den Lernprozess stark behindern.

Das Hauptproblem ist, dass die meisten Modelle annehmen, dass Daten mit starken Signalen immer die richtigen Labels sind. In Wirklichkeit kann diese Annahme zu einer schlechten Leistung führen, insbesondere wenn unterschiedliche Personen beteiligt sind. Verschiedene Menschen können die gleiche Aktivität unterschiedlich ausführen, was zu weiteren Komplikationen führt.

Einführung von VALERIAN

Um diese Herausforderungen anzugehen, stellen wir VALERIAN vor, eine neue Methode, die für rauschende Labels in HAR-Aufgaben entwickelt wurde. VALERIAN basiert auf drei Hauptideen: Es lernt Merkmale, die unabhängig davon konsistent bleiben, wer den Sensor trägt, es nutzt Techniken, um den Einfluss von rauschenden Labels zu bekämpfen, und es passt sich schnell an neue Personen an.

Selbstüberwachtes Lernen

Selbstüberwachtes Lernen ist der Schlüssel, um VALERIAN effektiv zu machen. Diese Methode ermöglicht es dem Modell, nützliche Merkmale aus Daten zu lernen, auch wenn keine Labels bereitgestellt werden. Durch Techniken wie Datenaugmentation – also Veränderungen an den Originaldaten – kann VALERIAN ein starkes Verständnis für menschliche Bewegungen entwickeln.

Invariante Merkmalslernen

Invariante Merkmalslernen hilft dem Modell, Muster zu erkennen, die über verschiedene Personen hinweg konsistent sind. Indem VALERIAN sich auf diese gemeinsamen Merkmale konzentriert, reduziert es das Rauschen, das durch individuelle Unterschiede entsteht. Anstatt jede Person als einzigartig zu betrachten, identifiziert es breitere Muster, die verallgemeinert werden können.

Schnelle Anpassung

Wenn VALERIAN zum ersten Mal auf eine neue Person trifft, kann es sich schnell mit nur einer kleinen Menge korrekt etikettierter Daten anpassen. Dies ist entscheidend für Anwendungen in Echtzeit, in denen schnelle Anpassungen nötig sind, wenn neue Daten eintreffen.

Bewertung von VALERIAN

Um zu sehen, wie gut VALERIAN funktioniert, wurden mehrere Bewertungen mit verschiedenen Datensätzen durchgeführt. Diese Datensätze umfassen sowohl kontrollierte Umgebungen, in denen die Labels genau bekannt sind, als auch chaotischere reale Umgebungen, in denen die Labels oft falsch sind.

Kontrollierte Datensätze

In kontrollierten Labors führen die Probanden spezifische Aufgaben aus, und ihre Handlungen werden genau überwacht. Dieses Setup erlaubt es, saubere Daten zu sammeln, die als Massstab für neue Methoden dienen. VALERIAN wurde gegen mehrere Basismethoden getestet, um zu sehen, wie gut es rauschende Labels korrigieren kann.

Die Ergebnisse zeigten, dass VALERIAN alle anderen Methoden erheblich übertraf. Es gelang, einen grossen Prozentsatz der Kennzeichnungsfehler zu korrigieren, was seine Effektivität selbst bei hohem Rauschen demonstriert.

Daten aus der realen Welt

In Datensätzen aus der realen Welt steigen die Herausforderungen. Probanden könnten gleichzeitig verschiedene Dinge tun, was zu einer Mischung von Aktivitäten führt. Rausch-Labels sind hier viel ausgeprägter. VALERIAN wurde unter diesen Bedingungen getestet, um zu sehen, ob es trotzdem gut abschneiden kann.

Trotz des Rauschens behielt VALERIAN eine solide Leistung bei. Es konnte sich erfolgreich an neue Probanden anpassen und Kennzeichnungsfehler effektiv korrigieren, was bestätigt, dass es auch ausserhalb kontrollierter Umgebungen zuverlässig funktioniert.

Wichtige Erkenntnisse

  1. Einfluss von Rausch-Labels: Rausch-Labels stellen eine grosse Herausforderung in HAR dar. Sie können Modelle in die Irre führen und ihre Effektivität verringern.

  2. Bedeutung der Subjektvielfalt: Verschiedene Menschen verhalten sich unterschiedlich, selbst während derselben Aktivität. VALERIAN’s Design erkennt diese Vielfalt an und nutzt sie zur Verbesserung des Lernens.

  3. Wirksamkeit des selbstüberwachten Lernens: Diese Methode ermöglicht es dem Modell, robuste Merkmale aus Rohdaten zu lernen, was zu grösserer Flexibilität und Anpassungsfähigkeit führt.

  4. Anpassungsfähigkeiten: VALERIANs Fähigkeit, sich schnell an neue Probanden anzupassen, unterscheidet es von vielen traditionellen Methoden, die oft umfangreiche Neutrainings erfordern.

Fazit

Die Erkennung menschlicher Aktivitäten in der echten Welt ist eine komplexe Aufgabe aufgrund der Anwesenheit von rauschenden Labels und der Vielfalt der Subjekte. VALERIAN bietet eine robuste Lösung, die diese Probleme direkt angeht. Es lernt nützliche Merkmale, ohne sich vollständig auf genaue Labels zu verlassen, passt sich schnell an neue Probanden an und bietet zuverlässige Leistungen, selbst unter stressigen, realen Bedingungen.

Indem VALERIAN die Herausforderungen durch rauschende Labels versteht und angeht, steht es als vielversprechender Ansatz zur Weiterentwicklung der HAR-Technologie. Seine Designprinzipien können auf andere Bereiche des maschinellen Lernens angewendet werden, in denen ähnliche Herausforderungen bestehen, und paving the way for even more effective techniques in the future.

Originalquelle

Titel: VALERIAN: Invariant Feature Learning for IMU Sensor-based Human Activity Recognition in the Wild

Zusammenfassung: Deep neural network models for IMU sensor-based human activity recognition (HAR) that are trained from controlled, well-curated datasets suffer from poor generalizability in practical deployments. However, data collected from naturalistic settings often contains significant label noise. In this work, we examine two in-the-wild HAR datasets and DivideMix, a state-of-the-art learning with noise labels (LNL) method to understand the extent and impacts of noisy labels in training data. Our empirical analysis reveals that the substantial domain gaps among diverse subjects cause LNL methods to violate a key underlying assumption, namely, neural networks tend to fit simpler (and thus clean) data in early training epochs. Motivated by the insights, we design VALERIAN, an invariant feature learning method for in-the-wild wearable sensor-based HAR. By training a multi-task model with separate task-specific layers for each subject, VALERIAN allows noisy labels to be dealt with individually while benefiting from shared feature representation across subjects. We evaluated VALERIAN on four datasets, two collected in a controlled environment and two in the wild.

Autoren: Yujiao Hao, Boyu Wang, Rong Zheng

Letzte Aktualisierung: 2023-03-03 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2303.06048

Quell-PDF: https://arxiv.org/pdf/2303.06048

Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel