Simple Science

Ciência de ponta explicada de forma simples

# Informática# Robótica# Inteligência Artificial# Aprendizagem de máquinas

Avanços em Saltos para Robôs Quadrúpedes

Um novo método ensina robôs quadrúpedes a pular de forma eficaz em várias direções.

― 5 min ler


Habilidades de Pular paraHabilidades de Pular paraRobôsde salto dos robôs.Novos métodos melhoram as capacidades
Índice

Pular é uma habilidade importante para robôs com pernas. Isso permite que eles atravessem terrenos difíceis, como áreas com buracos grandes ou mudanças repentinas de altura. Avanços recentes tornaram os robôs mais rápidos e confiáveis, mas muitos focaram mais na caminhada. Pular ainda é uma tarefa complicada porque os robôs têm que lidar com várias mudanças na posição dos pés e como se movem no ar. Este artigo fala sobre uma nova forma de ajudar robôs quadrúpedes a pularem melhor.

O Desafio de Pular

Quando um robô pula, todas as suas pernas saem do chão ao mesmo tempo, criando uma fase onde ele não toca na superfície. Essa fase permite que o robô cubra grandes distâncias sem parar, o que é crucial para enfrentar terrenos difíceis. A maioria das técnicas existentes lida principalmente com a caminhada, então os robôs não estão treinados o suficiente para pulos longos. Tradicionalmente, criar um bom plano de salto leva muito tempo e design cuidadoso.

Nossa Abordagem

Para superar esses desafios, criamos um sistema inteligente que ensina robôs quadrúpedes a pular em várias direções e distâncias. O sistema combina dois métodos principais: controle ótimo e Aprendizado por Reforço.

  1. Controlador de Postura: Essa parte calcula como o robô deve segurar seu corpo enquanto pula. Usa uma combinação de um controlador simples e uma parte aprendida para melhorar a estabilidade. O controlador simples inicia o processo de aprendizado, ajudando o robô a aprender mais rápido e com menos barulho.

  2. Controlador de Corpo Inteiro: Essa parte cuida de todos os movimentos do corpo do robô. Ela traduz comandos do controlador de postura em ações para os motores do robô.

Depois de treinar em um ambiente simulado, nosso método pode ser usado diretamente em um robô real. Ele permite vários estilos de salto, incluindo pulos de até 50 centímetros de altura, 60 centímetros para frente, ou até fazer uma curva no ar de até 90 graus.

Benefícios de Pular

Pular permite que robôs com pernas cubram grandes lacunas e naveguem por mudanças de altura de forma eficaz. Diferente da caminhada, onde os pés ficam no chão, pular permite que um robô distâncias sem contato com o solo. Isso é especialmente útil em áreas rochosas ou irregulares.

Combinando Controle e Aprendizado

Para ajudar o robô a aprender a pular bem, combinamos métodos de controle tradicionais com novas estratégias de aprendizado. As estratégias atuais geralmente assumem um modelo simples de como o robô se move, que funciona para a caminhada, mas falha em movimentos complexos como pular. Nosso método permite que o robô responda melhor a mudanças súbitas enquanto está no ar.

O controlador de postura desempenha um papel fundamental nesse sistema. Ele calcula a posição desejada do corpo necessária para pular ao fundir saídas do controlador de aceleração e da política aprendida. Começando com o controlador de aceleração, criamos um processo de treinamento mais limpo que resulta em um desempenho melhor em saltos.

Treinamento em Simulação

Treinamos nosso sistema usando uma versão simulada do robô quadrúpede Go1. Durante o treinamento, a estrutura aprendeu a pular continuamente e com precisão em várias direções. O sistema também permite ajustes em tempo real com base em diferentes alvos de pouso.

Para cada sessão de treinamento, definimos tarefas específicas de salto. O robô pratica pulos em diversas direções, ajudando-o a aprender a se adaptar rapidamente a novas situações.

Desempenho no Mundo Real

Após o treinamento, transferimos nosso sistema para o robô real sem precisar de ajustes adicionais. O robô Go1 completou com sucesso vários pulos altos em diferentes direções. Em testes da vida real, o robô alcançou alturas e distâncias impressionantes.

Embora o desempenho no mundo real tenha sido ligeiramente inferior ao da simulação, isso é comum devido a fatores não contabilizados no ambiente real, como limitações dos motores.

Comparando Métodos

Para garantir que nossa abordagem funciona, testamos contra outros métodos de treinamento. Removemos a política aprendida ou o controlador de aceleração para ver como o sistema se comportava sem uma das partes. Também tentamos uma abordagem comum de aprendizado por reforço que produz comandos de motor diretamente.

Nossa análise mostrou que o sistema usando o controlador de postura com a política aprendida superou consistentemente os outros métodos. Ele não só pulou mais alto, como também alcançou melhor estabilidade durante os saltos.

Conclusão

Pular é uma habilidade crucial para robôs com pernas. Nossa abordagem inovadora combina técnicas de controle tradicionais com métodos avançados de aprendizado para ensinar robôs a pular de forma contínua e eficaz. O sistema treinado se move diretamente da simulação para a vida real, permitindo pulos em qualquer direção e altura.

Embora nosso trabalho atual suporte um tipo de movimento de salto, acreditamos que adicionar mais variações poderia melhorar o desempenho. Pesquisas futuras também vão buscar equipar os robôs com a capacidade de perceber o ambiente, permitindo que eles naveguem por terrenos difíceis sozinhos.

Direções Futuras

Planejamos explorar mais estilos de salto, como saltitante ou galopante, para maximizar as habilidades de salto do robô. Integrar feedback sensorial ajudará o robô a entender melhor seu ambiente e tomar decisões melhores sobre quando e onde pular. Isso vai ampliar os limites do que robôs com pernas podem alcançar em diversos ambientes desafiadores.

Fonte original

Título: Continuous Versatile Jumping Using Learned Action Residuals

Resumo: Jumping is essential for legged robots to traverse through difficult terrains. In this work, we propose a hierarchical framework that combines optimal control and reinforcement learning to learn continuous jumping motions for quadrupedal robots. The core of our framework is a stance controller, which combines a manually designed acceleration controller with a learned residual policy. As the acceleration controller warm starts policy for efficient training, the trained policy overcomes the limitation of the acceleration controller and improves the jumping stability. In addition, a low-level whole-body controller converts the body pose command from the stance controller to motor commands. After training in simulation, our framework can be deployed directly to the real robot, and perform versatile, continuous jumping motions, including omni-directional jumps at up to 50cm high, 60cm forward, and jump-turning at up to 90 degrees. Please visit our website for more results: https://sites.google.com/view/learning-to-jump.

Autores: Yuxiang Yang, Xiangyun Meng, Wenhao Yu, Tingnan Zhang, Jie Tan, Byron Boots

Última atualização: 2023-04-17 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2304.08663

Fonte PDF: https://arxiv.org/pdf/2304.08663

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes