Simple Science

Ciência de ponta explicada de forma simples

# Informática# Robótica

Bi-Touch: Avançando a Interação com Robôs de Dois Braços

O sistema Bi-Touch melhora a habilidade dos robôs de manusear objetos com toque e visão.

― 8 min ler


Sistema Bi-TouchSistema Bi-TouchRevoluciona TarefasRobóticasprecisão através do feedback tátil.Novo robô de braço duplo melhora a
Índice

Robôs que conseguem usar os dois braços são super úteis para lidar com objetos grandes ou estranhos. Mas ensinar eles a fazer isso direitinho não é fácil. Uma área que ajuda a deixar os robôs mais espertos é o toque. Ao combinar o toque com informações visuais, os robôs conseguem realizar tarefas complexas com mais facilidade. Esse projeto apresenta um sistema robótico chamado Bi-Touch, que usa feedback do toque para gerenciar tarefas com os dois braços.

A Necessidade da Manipulação Bimanual

Manipulação bimanual significa usar as duas mãos para realizar uma tarefa. Isso é algo que os humanos fazem naturalmente e pode ser bom para os robôs também. Quando os robôs conseguem usar os dois braços, eles lidam melhor com objetos maiores e conseguem mover eles de forma mais flexível. Porém, construir sistemas que permitam que os robôs usem os dois braços efetivamente é bem complicado. A tecnologia não só é cara, mas descobrir como fazer esses braços trabalharem juntos também é um desafio.

O Sistema Bi-Touch

O sistema Bi-Touch é montado com dois braços robóticos industriais que não são tão caros. Equipamos esses braços com sensores especiais que conseguem sentir e detectar o toque. Esses sensores ajudam o robô a entender quanta força usar ao interagir com os objetos, o que é essencial para manter as coisas estáveis e evitar danos.

Tarefas de Manipulação Bimanual

O sistema Bi-Touch foi projetado para realizar três tipos principais de tarefas que precisam dos dois braços. Essas tarefas aproveitam a capacidade do robô de sentir e perceber:

  1. Bi-Pushing: Nessa tarefa, o robô usa os dois braços para mover um objeto grande ao longo de uma superfície. O objetivo é empurrar o objeto até um lugar específico.

  2. Bi-Reorienting: Essa tarefa envolve girar um objeto para um determinado ângulo sem levantá-lo. O robô precisa manter o objeto firme enquanto muda sua posição.

  3. Bi-Gathering: Nessa tarefa, o robô tem que empurrar dois objetos um em direção ao outro até que eles se toquem. É um pouco complicado porque o alvo se move enquanto os objetos são empurrados.

Aprendendo Através de Feedback

Para ensinar o robô a completar essas tarefas, usamos um método chamado Aprendizado por Reforço Profundo. Esse é um tipo de inteligência artificial que permite que os robôs aprendam com suas ações e melhorem com o tempo. O robô recebe recompensas quando avança em completar uma tarefa. Através desse reforço, o robô aprende as melhores ações a tomar em diferentes situações.

Para a tarefa de bi-pushing, o robô recebe recompensas por mover o objeto mais perto da posição alvo. Na bi-reorientação, a recompensa é baseada em quão bem o robô mantém a posição do objeto enquanto o gira para o ângulo desejado. Na bi-gathering, as recompensas aumentam à medida que os dois objetos ficam mais perto um do outro.

Desafios Encontrados

Enquanto treinávamos o sistema Bi-Touch, enfrentamos alguns desafios. Um problema grande foi a diferença entre o que o robô aprendeu nas simulações e o que ele vivenciou no mundo real. Às vezes, um robô treinado em uma simulação de computador apertava um objeto com muita força quando não era necessário, o que poderia causar danos.

Para resolver isso, fizemos ajustes na simulação, como mudar a forma como o robô interage com os objetos para ser mais sensível à pressão.

A Importância do Feedback Táctil

Usar o toque é crucial para tarefas que envolvem interação com objetos. A visão sozinha nem sempre é suficiente, especialmente quando a forma ou textura do objeto dificulta a visualização. Os sensores táteis fornecem informações ao robô sobre quão forte ele está segurando e se está prestes a soltar ou danificar um objeto.

O Feedback tátil é especialmente importante para tarefas que exigem precisão. Por exemplo, se um robô está tentando colocar um item frágil em algum lugar com cuidado, ele precisa saber quão forte empurrar e quando parar com base nas informações dos seus sensores.

Montando o Sistema de Dois Braços

O sistema Bi-Touch é composto por dois braços robóticos colocados em uma mesa onde eles podem alcançar um ao outro e os objetos que estão manipulando. Cada braço tem um sensor tátil na ponta que funciona como um dedo humano, fornecendo o feedback necessário sobre o contato entre o robô e o objeto.

Os sensores são projetados para serem acessíveis enquanto ainda oferecem feedback de alta resolução. Isso significa que conseguem detectar pequenas mudanças quando o robô toca em algo, o que é útil para manipulação fina.

A Estrutura de Aprendizado

O processo de aprendizado envolve várias etapas. Primeiro, o robô pratica em um ambiente simulado montado em uma ferramenta de software chamada Tactile Gym. Aqui, ele pode experimentar diferentes tarefas sem risco de quebrar equipamentos caros. Ele aprende a reagir com base no feedback que recebe dos sensores táteis enquanto realiza as tarefas.

Uma vez que o robô atinge um certo nível de desempenho na simulação, transferimos esse conhecimento para o sistema robótico real. Esse processo é conhecido como transferência "sim-to-real" e é essencial para garantir que o robô possa se sair bem em situações reais.

Experimentação e Resultados

Nos nossos experimentos, testamos quão bem o sistema Bi-Touch conseguia realizar as três tarefas usando vários objetos de diferentes formas, tamanhos e pesos. Para cada tarefa, medimos quão precisamente o robô conseguia manipular esses objetos e quão rápido conseguia completar as tarefas.

Resultados de Bi-Pushing

Na tarefa de bi-pushing, o robô mostrou sua habilidade de mover diferentes tipos de objetos usando os dois braços. Ele aprendeu com sucesso a empurrar os itens ao longo de um caminho pré-determinado, alcançando um alto nível de precisão. Os resultados mostraram que o robô conseguia seguir consistentemente a trajetória que foi treinado.

Resultados de Bi-Reorienting

Para a tarefa de bi-reorienting, o robô conseguiu girar vários objetos enquanto os mantinha no lugar. Novamente, ele mostrou uma alta taxa de precisão ao reorientar os objetos para ângulos específicos. O robô usou seu feedback tátil para garantir que não estava apertando ou danificando os objetos enquanto realizava a tarefa.

Resultados de Bi-Gathering

Na tarefa de bi-gathering, o robô enfrentou mais complexidade devido à necessidade de ajustar suas ações com base nos movimentos dos objetos. Apesar disso, conseguiu juntar os objetos como esperado. Incorporamos um novo método que forneceu ao robô subobjetivos, permitindo que ele aprendesse melhor como lidar com a tarefa quando a situação parava ou mudava.

Discussão

O sistema Bi-Touch se mostrou eficaz em executar tarefas que requerem toque. Sua capacidade de usar feedback tátil e proprioceptivo permite uma abordagem multidimensional para resolução de problemas. Isso é especialmente importante em aplicações do mundo real onde as condições podem mudar rapidamente.

À medida que desenvolvemos ainda mais esse sistema, também podemos explorar tarefas adicionais que exijam manipulação mais fina. Atualmente, o robô está configurado para levantar e manipular objetos sem precisar de uma mesa para descansar, o que apresenta um desafio interessante.

Direções Futuras

Olhando para o futuro, há várias maneiras de melhorar o sistema Bi-Touch. Por exemplo, poderíamos aprimorar os sensores táteis adicionando versões mais avançadas que possam medir forças de cisalhamento também. Isso poderia abrir novas possibilidades para tarefas que exigem um controle mais delicado.

Outra área a ser explorada é aplicar o sistema Bi-Touch a tarefas variadas que demandam precisão. Até agora, só arranhamos a superfície com nossas tarefas. Novas aplicações poderiam incluir tudo, desde automação de armazém até tecnologia assistiva para pessoas com dificuldades de mobilidade.

Conclusão

Em resumo, o sistema Bi-Touch representa um passo significativo no desenvolvimento de sistemas robóticos de dois braços que utilizam feedback tátil. A estrutura de aprendizado e os experimentos mostraram o potencial dos robôs para realizar tarefas complexas com alta precisão e adaptabilidade. Com pesquisa e desenvolvimento contínuos, pretendemos aprimorar ainda mais essa tecnologia para tornar os robôs ainda mais capazes e versáteis nas tarefas que conseguem realizar.

Fonte original

Título: Bi-Touch: Bimanual Tactile Manipulation with Sim-to-Real Deep Reinforcement Learning

Resumo: Bimanual manipulation with tactile feedback will be key to human-level robot dexterity. However, this topic is less explored than single-arm settings, partly due to the availability of suitable hardware along with the complexity of designing effective controllers for tasks with relatively large state-action spaces. Here we introduce a dual-arm tactile robotic system (Bi-Touch) based on the Tactile Gym 2.0 setup that integrates two affordable industrial-level robot arms with low-cost high-resolution tactile sensors (TacTips). We present a suite of bimanual manipulation tasks tailored towards tactile feedback: bi-pushing, bi-reorienting and bi-gathering. To learn effective policies, we introduce appropriate reward functions for these tasks and propose a novel goal-update mechanism with deep reinforcement learning. We also apply these policies to real-world settings with a tactile sim-to-real approach. Our analysis highlights and addresses some challenges met during the sim-to-real application, e.g. the learned policy tended to squeeze an object in the bi-reorienting task due to the sim-to-real gap. Finally, we demonstrate the generalizability and robustness of this system by experimenting with different unseen objects with applied perturbations in the real world. Code and videos are available at https://sites.google.com/view/bi-touch/.

Autores: Yijiong Lin, Alex Church, Max Yang, Haoran Li, John Lloyd, Dandan Zhang, Nathan F. Lepora

Última atualização: 2023-07-12 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2307.06423

Fonte PDF: https://arxiv.org/pdf/2307.06423

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes