Was bedeutet "TDSM"?
Inhaltsverzeichnis
TDSM ist ein Ansatz, der verwendet wird, um Aktionen basierend auf Skelettdaten zu erkennen, auch wenn die Aktionen vorher nicht gesehen wurden. Die Hauptidee hinter TDSM ist, die Merkmale von Skelettdaten mit Textbeschreibungen von Aktionen abzugleichen. Das hilft dem System, neue Aktionen genau vorherzusagen.
Traditionelle Methoden hatten Schwierigkeiten, weil die Skelettdaten und die Textdaten nicht leicht zusammenpassen, was es schwierig macht, effektiv zu lernen. TDSM lässt sich von der Art und Weise inspirieren, wie einige Text-zu-Bild-Modelle funktionieren, und konzentriert sich darauf, den Trainingsprozess zu verbessern. Anstatt neue Daten zu generieren, bringt es die Skelettmerkmale während des Trainings mit den Textbeschreibungen in Einklang.
Um den Abgleichsprozess zu verstärken, verwendet TDSM eine spezielle Technik namens Triplet Diffusion Loss. Das sorgt dafür, dass die richtigen Übereinstimmungen zwischen Skelett und Text näher zusammen sind, während die falschen weiter auseinander gedrückt werden. Dadurch zeigt TDSM bessere Leistungen als die aktuellen Top-Methoden und kann genauere Vorhersagen machen, wenn es auf neue Aktionen stößt.
Label-Noise Robuste Diffusionsmodelle
Modelle zu trainieren, die Daten generieren, erfordert oft große Datensätze, die verrauschte oder falsche Informationen enthalten können. Dieses Rauschen kann die Qualität der generierten Daten beeinträchtigen und sie weniger zuverlässig machen.
Um dieses Problem anzugehen, wird ein neuer Ansatz namens TDSM vorgestellt. Diese Methode konzentriert sich darauf, diese Modelle so zu trainieren, dass das Rauschen im Datensatz verwaltet wird. Sie kombiniert verschiedene Bewertungsmethoden und berücksichtigt, wie Labels sich im Laufe der Zeit ändern können. Indem der Prozess an diese Rauschfaktoren angepasst wird, verbessert TDSM die Qualität der generierten Ausgaben.
Durch Tests über verschiedene Datensätze hat TDSM gezeigt, dass es bessere Proben produzieren kann, die enger mit den beabsichtigten Bedingungen übereinstimmen. Diese Methode zeigt auch eine verbesserte Leistung im Vergleich zu standardmäßigen Methoden zur Korrektur von verrauschten Labels und erweist sich als effektive Strategie für das Training von Modellen in Gegenwart von Rauschen.