Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Avanços em Estimativa de Pose sem Marcadores para Reabilitação

Pesquisas mostram que é possível fazer análises de movimento precisas sem usar marcadores físicos.

― 8 min ler


Avanço na Estimação deAvanço na Estimação dePosição Sem Marcadoresanálise do movimento humano.Novos métodos melhoram a precisão na
Índice

A estimativa de pose sem marcadores é um método usado pra analisar o movimento humano sem precisar de marcadores físicos no corpo. Essa tecnologia pode ser super útil em ambientes de saúde, já que permite uma avaliação fácil e rápida de movimentos como andar. Isso pode levar a um melhor acompanhamento de problemas de caminhada e como os pacientes respondem aos tratamentos. Mas, ainda precisamos avaliar como diferentes técnicas de detecção de partes do corpo e criação de trajetórias de movimento afetam a precisão desse sistema.

Objetivo do Estudo

Esse estudo teve como objetivo coletar mais informações sobre como diferentes métodos de detecção de pontos-chave do corpo e estimativa das suas posições em 3D impactam a precisão da estimativa de pose sem marcadores. Especificamente, a gente queria descobrir quais técnicas fornecem os melhores resultados na avaliação do movimento humano.

Nossa Motivação

Como uma equipe que trabalha em reabilitação, nosso principal objetivo é desenvolver um sistema simples e confiável para analisar movimentos físicos em ambientes clínicos. Um sistema assim pode ajudar a avaliar melhor problemas de caminhada e respostas a tratamentos sem as complicações de sistemas tradicionais que muitas vezes exigem configurações especializadas.

Nossa Abordagem

Pra alcançar nosso objetivo, comparamos duas maneiras diferentes de detectar pontos-chave no corpo. O primeiro método é um sistema conhecido chamado OpenPose, que analisa a cena inteira pra identificar as localizações das articulações em todas as pessoas visíveis. O segundo método, da biblioteca MMPose, foca em um indivíduo por vez, normalmente levando a uma maior precisão.

Além disso, avaliamos três métodos para calcular onde essas articulações detectadas estão localizadas em 3D a partir de imagens 2D. O primeiro método triangula as localizações das articulações diretamente das imagens. O segundo método usa otimização pra encontrar as melhores posições para as articulações, garantindo que os movimentos pareçam suaves e consistentes. O terceiro método também usa otimização, mas envolve uma abordagem única que mapeia o tempo para as posições das articulações usando um tipo específico de função.

Coleta de Dados

Coletamos dados usando uma configuração personalizada que incluía várias câmeras. No total, usamos dez câmeras sincronizadas pra gravar participantes andando por uma área designada na nossa instalação. Essa configuração nos permitiu coletar imagens de vários ângulos, possibilitando uma avaliação mais precisa dos movimentos das articulações.

Inscrevemos 25 indivíduos com problemas de movimento variados, incluindo condições como AVC, tumores na coluna, lesões cerebrais, leve queda do pé, artrite no joelho e pessoas usando próteses. Os participantes variavam de idade de 27 a 78 anos, e alguns precisavam de ajudas para mobilidade. Nosso objetivo era garantir que os métodos que desenvolvemos funcionariam bem em um grupo diversificado de pacientes.

Processamento de Vídeo

O processamento dos vídeos envolveu o uso de uma ferramenta que desenvolvemos pra rastrear e identificar as poses dos participantes. Isso nos permitiu associar as posições das articulações detectadas em diferentes ângulos de câmera, ajudando a acompanhar os movimentos de cada indivíduo.

Usando software, processamos os dados de vídeo coletados pra extrair as informações necessárias sobre as localizações das articulações. Isso envolveu focar em áreas específicas de interesse, que foram delineadas usando caixas delimitadoras em volta de cada participante.

Métodos de Estimativa das Posições das Articulações

Utilizamos três métodos diferentes pra estimar as posições das articulações.

  1. Triangulação Robusta: Esse método combina informações de várias visões de câmera pra calcular as localizações das articulações. Ele vai além da triangulação básica, lidando com erros que surgem de identificações incorretas ou obstruções que podem ocorrer quando várias pessoas estão presentes.

  2. Otimização das Articulações: Esse método refina as posições das articulações minimizando as discrepâncias entre os pontos-chave detectados e suas contrapartes projetadas em 3D. Aplicando condições adicionais, ele garante que os resultados sejam suaves e anatomicamente consistentes.

  3. Otimização de Representação Implícita: Essa abordagem inovadora aprende as posições das articulações ao longo do tempo por meio de um algoritmo avançado que mapeia o tempo para trajetórias de movimento. Isso permite uma maneira flexível e eficiente de lidar com mudanças nas posições das articulações.

Avaliando a Precisão

Pra checar a precisão dos nossos métodos, comparamos nossas descobertas com dados coletados de um sistema tradicional de avaliação de marcha. Essa comparação nos permitiu identificar as diferenças nas posições das articulações registradas pelos nossos métodos em relação ao sistema estabelecido.

Nossa análise revelou que o método de usar um detector de pontos-chave de cima pra baixo e a representação implícita pra estimar os movimentos das articulações resultaram na melhor precisão, mostrando discrepâncias de apenas 8 mm em termos de largura de passo quando comparado ao sistema tradicional.

Usabilidade do Sistema

Achamos nosso sistema fácil de usar e eficiente. O tempo de configuração rápido, junto com a ferramenta de anotação que desenvolvemos, nos permitiu agilizar o processo de identificação dos participantes nos vídeos adquiridos. Mesmo com várias pessoas na mesma área, conseguimos rastrear os movimentos de cada sujeito com sucesso.

No geral, o pipeline de processamento que usamos facilitou a gestão de um grande volume de dados coletados durante nossos experimentos.

Resultados Qualitativos

Criamos vídeos que ilustravam nossas reconstruções de movimento. Ao revisar esses vídeos pra diferentes métodos, descobrimos que os pontos-chave detectados usando MMPose estavam mais alinhados com as localizações reais das articulações em comparação com os pontos-chave do OpenPose. Além disso, as técnicas de otimização que aplicamos levaram a movimentos mais suaves e anatomicamente corretos, em comparação com o método de triangulação bruta, que teve mais ruídos durante o rastreamento.

Análise de Consistência

Avaliamos quão bem nossos movimentos reconstruídos combinavam com as detecções 2D originais. Isso envolveu medir a distância entre os pontos 3D re-mapeados e os pontos-chave detectados originalmente. Encontramos uma diferença significativa no desempenho com base no método de detecção de pontos-chave e no algoritmo de reconstrução usado.

Por exemplo, o método MMPose superou consistentemente o OpenPose, especialmente quando se tratou de manter a consistência geométrica nas reconstruções.

Comparação com Métodos Tradicionais

Ao comparar nossas descobertas com o sistema GaitRite, notamos que o método MMPose apresentou taxas de erro substancialmente mais baixas do que o OpenPose. Isso destaca a eficácia de usar abordagens de cima pra baixo pra detectar partes do corpo ao analisar o movimento.

Reconhecemos que usar pistas visuais pra detectar movimento pode levar a algumas discrepâncias quando comparado a sistemas baseados em pressão como o GaitRite, que funciona de maneira diferente. No entanto, acreditamos que nossa abordagem pode fornecer insights valiosos sobre padrões de movimento, especialmente quando olhamos mudanças ao longo do tempo.

Desafios e Trabalho Futuro

Embora tenhamos alcançado um sucesso considerável com nossa análise, também reconhecemos áreas pra melhorar. Percebemos que a precisão dos nossos resultados poderia se beneficiar do aprimoramento dos métodos de detecção de pontos-chave 2D usados. Notamos alguns preconceitos específicos na forma como certas partes do corpo foram detectadas, o que poderia ser abordado em futuras iterações da nossa abordagem.

Outra área de foco é melhorar nossos métodos pra reduzir qualquer ruído que possa surgir em situações onde as pessoas estão próximas umas das outras. Esperamos que a implementação de novas técnicas de múltiplas visões possa melhorar ainda mais nossa precisão.

Por fim, desenvolver medidas de confiança pra quantificar a precisão do nosso rastreamento será crucial para futuras aplicações clínicas.

Conclusão

Em resumo, nosso trabalho demonstrou a viabilidade de usar um sistema multicâmera pra coletar dados de marcha em um ambiente de reabilitação. O processo rápido de coleta de dados e a capacidade de analisar esses dados efetivamente nos permitiram explorar padrões de caminhada em um grupo diversificado de participantes.

No final das contas, descobrimos que a combinação do MMPose com a representação implícita de trajetória nos proporcionou as estimativas mais precisas de movimento, com discrepâncias de largura e comprimento de passo permanecendo abaixo de 10 mm. Esses resultados promissores ajudarão a refinar nosso sistema para um uso clínico mais amplo na avaliação de distúrbios de movimento e progresso da reabilitação.

Fonte original

Título: Improved Trajectory Reconstruction for Markerless Pose Estimation

Resumo: Markerless pose estimation allows reconstructing human movement from multiple synchronized and calibrated views, and has the potential to make movement analysis easy and quick, including gait analysis. This could enable much more frequent and quantitative characterization of gait impairments, allowing better monitoring of outcomes and responses to interventions. However, the impact of different keypoint detectors and reconstruction algorithms on markerless pose estimation accuracy has not been thoroughly evaluated. We tested these algorithmic choices on data acquired from a multicamera system from a heterogeneous sample of 25 individuals seen in a rehabilitation hospital. We found that using a top-down keypoint detector and reconstructing trajectories with an implicit function enabled accurate, smooth and anatomically plausible trajectories, with a noise in the step width estimates compared to a GaitRite walkway of only 8mm.

Autores: R. James Cotton, Anthony Cimorelli, Kunal Shah, Shawana Anarwala, Scott Uhlrich, Tasos Karakostas

Última atualização: 2023-03-08 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2303.02413

Fonte PDF: https://arxiv.org/pdf/2303.02413

Licença: https://creativecommons.org/licenses/by-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes