O que significa "TDSM"?
Índice
TDSM é um método usado pra reconhecer ações com base em dados de esqueleto em situações onde as ações não foram vistas antes. A ideia principal por trás do TDSM é combinar as características dos dados de esqueleto com descrições de ações em texto. Isso ajuda o sistema a prever novas ações com mais precisão.
Métodos tradicionais enfrentaram dificuldades porque os dados de esqueleto e os dados em texto não se encaixam facilmente, o que dificulta o aprendizado eficaz. O TDSM se inspira em como alguns modelos de texto pra imagem funcionam e foca em melhorar o processo de treinamento. Em vez de gerar novos dados, ele alinha as características do esqueleto com as descrições em texto durante o treinamento.
Pra deixar o processo de combinação mais forte, o TDSM usa uma técnica especial chamada triplet diffusion loss. Isso ajuda a garantir que as correspondências corretas entre esqueleto e texto fiquem mais perto e as incorretas fiquem mais afastadas. Como resultado, o TDSM tem um desempenho melhor que os métodos mais atuais, permitindo previsões mais precisas em situações onde encontra novas ações.
Modelos de Difusão Resistentes ao Ruído dos Rótulos
Treinar modelos pra gerar dados geralmente requer conjuntos de dados grandes, que podem incluir informações ruidosas ou incorretas. Esse ruído pode prejudicar a qualidade dos dados gerados e torná-los menos confiáveis.
Pra lidar com esse problema, uma nova abordagem chamada TDSM foi apresentada. Esse método foca em treinar esses modelos de um jeito que gerencia o ruído presente no conjunto de dados. Ele combina diferentes métodos de pontuação e considera como os rótulos podem mudar ao longo do tempo. Ao personalizar o processo pra levar em conta esses fatores de ruído, o TDSM melhora a qualidade dos resultados gerados.
Através de testes em diferentes conjuntos de dados, o TDSM mostrou que consegue produzir amostras melhores que se alinham mais de perto com as condições pretendidas. Esse método também demonstra um desempenho melhor em comparação aos métodos padrão de correção de rótulos ruidosos, provando ser uma estratégia eficaz pra treinar modelos na presença de ruído.