Robôs de Navegação: Entendendo o Movimento Humano em Espaços Lotados
Pesquisadores estudam como os humanos se movem pra ensinar robôs a se locomoverem socialmente em multidões.
― 7 min ler
Índice
Os humanos são bons em se mover em lugares cheios. A gente faz isso todo dia sem esbarrar uns nos outros ou causar confusão. A gente comunica nossas intenções, segue regras sociais e se ajusta às ações dos outros. Mas os robôs que se movem em espaços públicos enfrentam muitos desafios. Eles podem ficar presos em multidões, confundir as pessoas ou até causar acidentes. Pra ajudar os robôs a aprenderem a navegar socialmente, os pesquisadores estão analisando como os humanos se movem e se comportam naturalmente em espaços públicos.
O que é Navegação Social?
Navegação social é quando um robô consegue se mover em direção a um objetivo levando em consideração a presença e as ações de outras pessoas. Os humanos fazem isso super bem. A gente cria caminhos em meio às multidões, usa os olhos e o corpo pra mostrar pra onde quer ir e age de forma educada, esperando a nossa vez ou se afastando pra deixar os outros passarem. Com os robôs se tornando mais comuns em áreas públicas, eles precisam aprender a navegar de um jeito parecido.
O Problema com os Robôs
Apesar dos avanços na robótica, os robôs ainda têm um longo caminho pela frente quando se trata de navegar entre as pessoas. Eles geralmente têm dificuldade em ambientes movimentados, o que pode levar a situações em que eles podem parar de repente ou se mover de maneiras que não são esperadas pelos pedestres. Isso faz as pessoas se preocuparem com a segurança de ter robôs por perto. O principal problema é que não tem dados suficientes disponíveis pra os robôs aprenderem a se mover socialmente.
Coletando Dados
Uma solução pra ajudar os robôs a aprenderem é coletar dados da navegação humana em situações da vida real. Pesquisadores desenvolveram um sistema de sensores especial que as pessoas podem usar na cabeça enquanto andam por espaços públicos. Esse sistema inclui vários sensores pra capturar como as pessoas se movem e interagem com os outros. Esses dados podem ser usados pra ensinar os robôs a navegar de uma maneira que considera os aspectos sociais.
O Sistema de Sensores
O sistema de sensores vestível é feito pra coletar informações enquanto alguém anda por aí. Ele inclui:
- LiDAR 3D: Esse sensor mede distâncias e cria um mapa 3D do ambiente.
- Câmera Estéreo e de Profundidade: Essa câmera captura imagens e informações de profundidade, ajudando o robô a entender melhor os arredores.
- IMU (Unidade de Medição Inercial): Esse sensor rastreia movimento e orientação.
- Array de Microfones: Isso coleta som, que pode ser útil pra entender o ambiente.
- Câmera 360: Essa captura uma visão completa dos arredores.
Usando esse sistema de sensores, os pesquisadores conseguem coletar uma grande quantidade de dados de diferentes lugares públicos, que incluem como as pessoas navegam e interagem entre si.
O Conjunto de Dados MuSoHu
Os dados coletados com esse sistema de sensores resultaram no que é chamado de conjunto de dados Multi-modal Social Human Navigation (MuSoHu). Essa é uma grande coleção de informações sobre como os humanos navegam em ambientes sociais. Inclui cerca de dez horas de interações gravadas, cobrindo uma distância de aproximadamente 50 quilômetros. Os dados incluem vários tipos de cenários, como caminhadas casuais ou correndo pra um destino, e contém anotações detalhadas das interações sociais que acontecem no caminho.
Como os Humanos Navegam
Os humanos exibem uma variedade de comportamentos ao se mover em lugares públicos. Eles naturalmente formam grupos, se comunicam através da linguagem corporal e ajustam sua velocidade com base no que está ao redor. Por exemplo, ao se aproximar de uma área cheia de gente, as pessoas podem desacelerar, olhar ao redor ou mudar de direção pra evitar conflitos. Essas ações são baseadas em normas sociais e expectativas, que os robôs precisam aprender a seguir.
Ensinando Robôs Usando MuSoHu
Usando o conjunto de dados MuSoHu, os pesquisadores pretendem ensinar os robôs a navegar de uma maneira socialmente aceitável. Com esses dados, os robôs podem aprender a imitar comportamentos humanos e tomar decisões que estão mais alinhadas com as normas sociais. Por exemplo, um robô poderia aprender a desacelerar ou parar ao se aproximar de um grupo de pessoas ou mudar seu caminho pra evitar colisões.
Importância do Contexto
Outro aspecto vital da navegação humana é o contexto. Por exemplo, a maneira como alguém se move em uma área cheia de gente pode mudar dependendo se está com pressa ou dando uma volta tranquilamente. Essa consciência do contexto é algo que o conjunto de dados MuSoHu capta. A capacidade de reconhecer e responder a diferentes Contextos pode ajudar os robôs a navegar de forma mais eficaz em situações do mundo real.
Direções Futuras de Pesquisa
O conjunto de dados MuSoHu abre muitas possibilidades para mais pesquisas na navegação social de robôs. Aqui estão algumas áreas potenciais para exploração:
- Aprendendo Diferentes Estilos de Navegação: A pesquisa poderia estudar diferentes formas que as pessoas navegam com base na cultura. Entender as variações culturais na navegação humana poderia ajudar a projetar robôs que se encaixem melhor em sociedades específicas.
- Adaptando o Movimento dos Robôs: Como robôs e humanos se movem de forma diferente, os pesquisadores precisam explorar como adaptar o processo de aprendizado. Isso pode envolver novas técnicas que ajudem os robôs a aprender com as ações humanas apesar das diferenças no movimento.
- Melhorando Ambientes de Simulação: Criar simulações realistas para a navegação social pode ajudar a testar e melhorar os sistemas de navegação dos robôs. Usando os dados do MuSoHu, os pesquisadores podem criar modelos de simulação melhores que reflitam as interações do mundo real.
- Aprimorando a Comunicação dos Robôs: A navegação humana inclui muitas formas de comunicação não verbal. Os pesquisadores podem investigar como os robôs podem se expressar melhor em relação às suas intenções para aqueles ao redor, como usar luzes ou sons pra indicar seus planos de movimento.
Conclusão
A capacidade dos robôs de navegar de forma socialmente aceitável é essencial pra sua integração nas nossas vidas diárias. O conjunto de dados MuSoHu é um passo significativo em direção a ensinar os robôs a se mover em espaços públicos, considerando tanto seus objetivos quanto a presença dos outros. Ao aproveitar os comportamentos naturais de navegação dos humanos, os pesquisadores podem ajudar a desenvolver robôs que navegam de uma maneira que pareça segura e confortável para as pessoas. À medida que esse campo evolui, a pesquisa contínua provavelmente levará a robôs que podem interagir melhor com seus ambientes e as pessoas que estão dentro deles.
Título: Toward Human-Like Social Robot Navigation: A Large-Scale, Multi-Modal, Social Human Navigation Dataset
Resumo: Humans are well-adept at navigating public spaces shared with others, where current autonomous mobile robots still struggle: while safely and efficiently reaching their goals, humans communicate their intentions and conform to unwritten social norms on a daily basis; conversely, robots become clumsy in those daily social scenarios, getting stuck in dense crowds, surprising nearby pedestrians, or even causing collisions. While recent research on robot learning has shown promises in data-driven social robot navigation, good-quality training data is still difficult to acquire through either trial and error or expert demonstrations. In this work, we propose to utilize the body of rich, widely available, social human navigation data in many natural human-inhabited public spaces for robots to learn similar, human-like, socially compliant navigation behaviors. To be specific, we design an open-source egocentric data collection sensor suite wearable by walking humans to provide multi-modal robot perception data; we collect a large-scale (~100 km, 20 hours, 300 trials, 13 humans) dataset in a variety of public spaces which contain numerous natural social navigation interactions; we analyze our dataset, demonstrate its usability, and point out future research directions and use cases.
Autores: Duc M. Nguyen, Mohammad Nazeri, Amirreza Payandeh, Aniket Datar, Xuesu Xiao
Última atualização: 2023-08-09 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2303.14880
Fonte PDF: https://arxiv.org/pdf/2303.14880
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.