Simple Science

Ciência de ponta explicada de forma simples

# Informática# Robótica# Visão computacional e reconhecimento de padrões# Interação Homem-Computador# Aprendizagem de máquinas

Robôs Aprendendo a Prever Movimentos Humanos

Um novo método ajuda robôs a antecipar como as pessoas se movem em espaços compartilhados.

― 6 min ler


Prevendo MovimentosPrevendo MovimentosHumanos com Robôsinterações mais seguras.usando características humanas praRobôs melhoram previsões de movimento
Índice

Navegar de boa em lugares como casas e escritórios exige que os robôs prevejam como as pessoas vão se mover. Isso é importante porque os humanos nem sempre seguem caminhos claros e podem aparecer de repente de lugares como cantos ou portas. No nosso trabalho, apresentamos uma nova forma de os robôs anteciparem os movimentos humanos usando tecnologia avançada.

O Desafio de Prever o Movimento Humano

Os robôs precisam ser capazes de detectar pessoas no ambiente e tomar decisões baseadas em como é provável que os humanos se movam. Tem três tarefas principais: Percepção, Previsão e Planejamento.

  1. Percepção: É sobre notar as pessoas e entender o que tá rolando ao redor.
  2. Previsão: Isso significa descobrir pra onde as pessoas podem ir a seguir.
  3. Planejamento: Os robôs precisam decidir como se mover em direção ao seu objetivo, evitando colisões com os humanos.

Enquanto já estudaram muito como os carros se movem, prever o movimento humano em lugares do dia a dia, como casas ou hospitais, é menos comum, mas super importante.

Por Que os Humanos São Diferentes

Os humanos se movem de um jeito muito menos previsível do que os carros. Eles podem andar, correr, parar ou mudar de direção rapidinho, dependendo do que precisam fazer. Isso significa que um robô em um escritório movimentado tem que lidar com muitos movimentos imprevisíveis de várias pessoas ao mesmo tempo.

Além disso, em espaços menores, tem sempre coisas no caminho, tipo paredes e móveis, que podem bloquear a visão do robô até que ele esteja bem perto. Portanto, o robô precisa agir rápido e com precisão, baseado nas informações limitadas que tem.

Nossa Solução: Usando Características Humanas

Pra melhorar como os robôs preveem os movimentos humanos, criamos um sistema que usa diferentes tipos de informações sobre uma pessoa. Isso inclui:

  • Onde a pessoa tá: O robô acompanha as posições das pessoas.
  • Pra onde elas tão olhando: O robô observa os movimentos da cabeça.
  • Postura do corpo: O robô usa modelos 3D pra entender como a pessoa tá parada ou se movendo.

Essa abordagem permite que os robôs reúnam um monte de informações sem precisar de dados perfeitos. Ajuda os robôs a fazerem previsões melhores sobre pra onde as pessoas vão.

A Importância das Características Humanas

Os humanos emitem sinais visuais, como pra onde olham ou como se movem, que podem dizer muito a um robô sobre suas intenções. Por exemplo, se uma pessoa vira a cabeça ou olha em uma direção específica, isso é uma dica forte de pra onde ela pode ir. Usar esse tipo de informação pode melhorar muito as previsões do robô.

Contribuições Principais do Nosso Trabalho

  1. Adaptação à Navegação Humana: Focamos em como fazer os robôs preverem melhor os movimentos em ambientes onde humanos estão frequentemente.
  2. Uso de Características Visuais: Nosso sistema incorpora características 3D, como posições do corpo, pra oferecer uma compreensão mais clara das ações humanas.
  3. Lidando com Dados Limitados: Mostramos como usar pistas visuais é especialmente útil quando os robôs têm pouca informação sobre os movimentos passados de uma pessoa.

O Framework de Previsão

Desenvolvemos um sistema avançado que processa diferentes tipos de informações. Veja como funciona:

  1. Coleta de Dados: Os robôs usam seus sensores pra reunir dados sobre as posições, movimentos da cabeça e posturas dos corpos.
  2. Processamento das Informações: O sistema combina essas informações usando uma arquitetura especial que permite considerar as relações entre diferentes características humanas.
  3. Fazendo Previsões: O robô então prevê pra onde a pessoa vai em breve, levando em conta a incerteza do comportamento humano.

Pesquisas Anteriores e Limitações

Muitos estudos já olharam como prever pra onde os carros vão. Esses estudos geralmente focam em dados simples de posição e não incluem uma visão mais profunda sobre as pessoas envolvidas. Teve algumas pesquisas juntando movimentos do corpo humano com previsões de trajetória, mas muitas vezes isso é feito em ambientes controlados, que não refletem as condições do mundo real.

Testando Nosso Sistema

Pra validar nossa abordagem, testamos em vários ambientes do mundo real. Acompanhamos quão bem nosso modelo se saiu em comparação com outros métodos. Nosso objetivo era mostrar que incluir características humanas leva a previsões melhores em espaços lotados.

O Papel das Características Baseadas em Visão

Nossas descobertas mostram que usar características visuais melhora a precisão das previsões, especialmente quando tem pouca informação histórica sobre uma pessoa. Quando os robôs encontravam uma pessoa nova, confiar apenas nas posições passadas não resultava em boas previsões. Porém, quando incluímos características visuais como a postura do corpo, nosso modelo previu com precisão pra onde a pessoa ia se mover a seguir.

Coleta de Dados e Avaliação

Usamos conjuntos de dados existentes pra avaliar nosso modelo. Muitos desses conjuntos eram limitados, já que foram gravados em ambientes específicos, muitas vezes usando uma única câmera. Nosso objetivo era mostrar que nossa abordagem pode se adaptar a diversas situações, melhorando significativamente o desempenho das previsões.

Resultados na Navegação Centrada no Humano

Através de vários testes, demonstramos que nossa arquitetura melhora efetivamente as previsões em ambientes onde humanos estão ativos. Notamos resultados melhores em situações sociais onde as pessoas interagem de perto. Isso é crucial pra robôs trabalhando ao lado de humanos em lugares movimentados.

Conclusão

Nossa pesquisa oferece uma nova perspectiva sobre como os robôs podem antecipar e responder aos movimentos humanos em espaços compartilhados. Ao usar informações sobre características humanas, melhoramos significativamente a precisão das previsões de movimento. Nosso trabalho abre portas pra futuros estudos que podem aprimorar ainda mais esses sistemas, especialmente em ambientes dinâmicos do mundo real.

Robôs que entendem melhor o movimento humano podem levar a interações mais seguras e eficazes, tornando os espaços do dia a dia mais navegáveis tanto pra robôs quanto pra pessoas.

Fonte original

Título: Robots That Can See: Leveraging Human Pose for Trajectory Prediction

Resumo: Anticipating the motion of all humans in dynamic environments such as homes and offices is critical to enable safe and effective robot navigation. Such spaces remain challenging as humans do not follow strict rules of motion and there are often multiple occluded entry points such as corners and doors that create opportunities for sudden encounters. In this work, we present a Transformer based architecture to predict human future trajectories in human-centric environments from input features including human positions, head orientations, and 3D skeletal keypoints from onboard in-the-wild sensory information. The resulting model captures the inherent uncertainty for future human trajectory prediction and achieves state-of-the-art performance on common prediction benchmarks and a human tracking dataset captured from a mobile robot adapted for the prediction task. Furthermore, we identify new agents with limited historical data as a major contributor to error and demonstrate the complementary nature of 3D skeletal poses in reducing prediction error in such challenging scenarios.

Autores: Tim Salzmann, Lewis Chiang, Markus Ryll, Dorsa Sadigh, Carolina Parada, Alex Bewley

Última atualização: 2023-09-29 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2309.17209

Fonte PDF: https://arxiv.org/pdf/2309.17209

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes