Simple Science

Ciência de ponta explicada de forma simples

# Informática# Robótica# Inteligência Artificial

Apresentando o Barkour Benchmark para Agilidade de Robôs

Uma nova avaliação de percurso de obstáculos para robôs quadrúpedes inspirada na agilidade dos cães.

― 10 min ler


Barkour: Um ReferencialBarkour: Um Referencialpara Robôsnovo percurso de agilidade.Avaliando robôs quadrúpedes usando um
Índice

Os animais desenvolveram várias maneiras de se mover rapidamente e com Agilidade, como correr e pular. Isso fez com que pesquisadores criassem robôs que conseguem imitar esses movimentos e lidar com ambientes difíceis com velocidade e controle. No entanto, falta uma forma padrão de testar como esses robôs se saem em termos de agilidade.

Para resolver isso, a gente criou o benchmark Barkour, que é um percurso de obstáculos feito pra avaliar a agilidade de robôs com patas. Baseado em competições de agilidade de cães, ele tem vários desafios e usa um sistema de cronometragem pra pontuação. Esse formato incentiva os pesquisadores a desenvolver sistemas que não só se movem rápido, mas que também fazem isso de maneira flexível.

Pra estabelecer bases sólidas de desempenho, desenvolvemos dois métodos pra enfrentar o benchmark Barkour. O primeiro método envolve treinar habilidades especializadas através de aprendizado por reforço, onde os robôs aprendem a navegar por diferentes obstáculos. O segundo método destila essas habilidades especializadas em uma política de Locomoção unificada e flexível chamada Locomotion-Transformer. Essa abordagem permite que o robô adapte seu movimento dependendo do ambiente que ele percebe.

Usando um robô quadrúpedo customizado, descobrimos que nossos métodos conseguiam navegar pelo percurso a cerca da metade da velocidade de um cão típico. Queremos que nosso trabalho seja um passo em direção à criação de robôs que tenham a agilidade dos animais.

A Estrutura Física

O percurso Barkour é projetado pra caber em uma área de 5 x 5, contendo quatro obstáculos principais: postes de zigue-zague, uma estrutura em A, uma tábua de salto e mesas de pausa. O robô deve completar o percurso se movendo por esses desafios de forma eficiente.

A gente viu um crescimento no desenvolvimento de robôs inspirados nos movimentos dos animais. Exemplos notáveis incluem o ETH ANYmal, o MIT Mini Cheetah e o Boston Dynamics Spot. Uma pergunta chave nessa área é como construir um controlador que permita que esses robôs realizem ações como um animal faria, enquanto navegam por vários obstáculos e terrenos.

Apesar dos avanços, um grande problema na robótica é a falta de maneiras padrão de avaliar como esses sistemas conseguem se mover. Muitas vezes, os resultados são apresentados usando métodos diferentes, dificultando comparações. A gente propõe que métricas padronizadas sejam desenvolvidas para medir com precisão a agilidade robótica e criar um conjunto comum de tarefas que todos possam concordar.

Um bom benchmark pra movimento ágil deve ser desafiador, mas alcançável, exigindo uma variedade de movimentos básicos que animais de verdade também realizam.

Já existem benchmarks estabelecidos pra medir o desempenho animal, como competições de agilidade de cães. Nesses eventos, os cães correm por um percurso de obstáculos pré-definido, enfrentando desafios como saltos e túneis. O desempenho é avaliado com base na velocidade e precisão, com penalidades por erros.

Inspirados por essas competições, apresentamos o percurso de obstáculos Barkour, uma configuração exigente de parkour especificamente para robôs quadrúpedes. Esse novo conjunto de benchmarks visa avaliar a agilidade e o desempenho robótico com precisão.

Visão Geral do Barkour

O benchmark Barkour consiste em diversos obstáculos colocados em uma área compacta, projetados pra exigir uma variedade de habilidades de movimento, como correr e pular. Pra marcar pontos, o robô deve completar o percurso dentro de um tempo específico, semelhante às competições de agilidade de cães. Quanto mais rápido o robô completa o percurso, maior a pontuação que recebe.

Pra avaliar o benchmark Barkour, configuramos uma simulação e dois métodos baseados em aprendizado como Referências de desempenho. O primeiro método usa Políticas especializadas treinadas pra enfrentar obstáculos individuais. O segundo método junta essas políticas em uma única política de locomoção geral que pode lidar com uma variedade de desafios.

Nossas contribuições incluem estabelecer o benchmark Barkour pra avaliar a agilidade de robôs quadrúpedes, introduzir os dois métodos pra resolver o benchmark e fornecer uma análise detalhada de como as políticas aprendidas se transferem da simulação para aplicações do mundo real.

Trabalhos Relacionados

Benchmarks são críticos pra avançar técnicas de inteligência artificial, assim como o ImageNet é pra visão computacional. Enquanto muitos esforços se concentraram em desenvolver novos algoritmos e controladores, poucos trabalharam pra criar um método sistemático pra avaliar a agilidade robótica.

Estudos anteriores analisaram métricas que medem diferentes habilidades, como saltar e equilibrar, mas frequentemente carecem de ambientes padronizados que permitam comparações rápidas. Ao incluir um percurso de obstáculos consistente e uma métrica de desempenho geral clara, o Barkour pretende preencher essa lacuna.

Combinar aprendizado por reforço com outras técnicas permite que robôs naveguem por terrenos irregulares com estabilidade. Avanços em percepção e visão também ajudam a melhorar a adaptabilidade desses robôs. Nosso trabalho se baseia em descobertas anteriores, enfatizando agilidade e a capacidade de realizar múltiplas habilidades.

Enquanto algumas pesquisas focaram na velocidade, nós priorizamos uma mistura de manobrabilidade e velocidade em terrenos complexos. Nossos métodos buscam alcançar uma variedade de movimentos ágeis, permitindo que os robôs realizem várias tarefas de forma coesa.

Design do Percurso Barkour

O percurso Barkour consiste em quatro obstáculos principais: mesas de pausa, postes de zigue-zague, uma estrutura em A e um salto largo. O design visa desafiar a agilidade e precisão do robô, exigindo que ele realize vários movimentos pra navegar pelo percurso com sucesso.

Começando pela mesa de pausa inicial, o robô deve passar por uma série de postes, escalar a estrutura em A, pular pelo salto largo e finalmente alcançar a mesa de fim. Cada obstáculo testa diferentes habilidades, e completá-los rapidamente é vital pra uma alta pontuação.

Pontuação no Barkour

A pontuação de agilidade no Barkour mede quão rápido um robô consegue completar o percurso de obstáculos com sucesso. A pontuação é baseada no tempo, com deduções por quaisquer obstáculos não cumpridos ou pulados e penalidades por ultrapassar o limite de tempo.

O tempo alocado é calculado com base no desempenho esperado de um cão em uma competição comparável. No Barkour, robôs podem ganhar uma pontuação máxima ao terminar o percurso rapidamente e sem cometer erros.

Mantendo o sistema de pontuação simples, buscamos que ele seja facilmente adotado tanto em simulações quanto em testes do mundo real, garantindo uma avaliação justa de diferentes designs e abordagens robóticas.

Soluções de Base

Pra garantir benchmarks fortes pro percurso Barkour, desenvolvemos duas soluções base pra locomoção robótica. A primeira envolve treinar políticas especializadas pra várias habilidades necessárias pra enfrentar os obstáculos. A segunda destila essas habilidades em uma política generalista chamada Locomotion-Transformer.

Nosso objetivo é demonstrar que usar o benchmark Barkour pode avançar técnicas de controle pra robôs ágeis. Ao estabelecer essas soluções base, criamos uma fundação pra trabalhos futuros focados em melhorar a agilidade robótica.

Aprendizado de Políticas Especializadas

A primeira solução base treina três políticas especializadas que cobrem habilidades-chave necessárias pra Barkour: andar em terrenos irregulares, escalar inclinações e pular. Cada política é projetada pra lidar com tarefas específicas, permitindo que o robô se destaque nos desafios apresentados pelo percurso.

Pra resolver essas tarefas, o robô utiliza várias observações e ações, que são cuidadosamente ajustadas pra se adequar a cada obstáculo. Isso permite um treinamento completo e uma avaliação de desempenho eficaz no benchmark Barkour.

Política Generalista Locomotion-Transformer

A segunda solução base visa criar uma única política generalista que possa lidar com todos os desafios do percurso Barkour. Essa abordagem simplifica a navegação usando uma política destilada que pode transitar suavemente entre diferentes habilidades sem precisar trocar entre políticas especializadas separadas.

Esse método permite uma maior adaptabilidade e flexibilidade nos movimentos do robô, permitindo que ele enfrente vários obstáculos de forma tranquila durante uma corrida.

Hardware do Robô

Pra testar totalmente o benchmark Barkour e seus efeitos na agilidade robótica, desenvolvemos um robô quadrúpedo específico. Esse robô é projetado pra imitar o tamanho e as capacidades de quadrúpedes do mundo real, o que nos ajuda a avaliar quão bem ele pode se sair nessas condições desafiadoras.

Utilizamos vários componentes, incluindo motores específicos pra controlar os movimentos dos membros, sensores pra rastrear a posição e métodos pra controlar o robô durante os desafios. Essa configuração de hardware é crucial pra coletar dados sobre o desempenho de diferentes políticas e melhorar a agilidade do robô.

Experimentos e Discussões

A gente avalia o desempenho das políticas especializadas e generalistas no benchmark Barkour. Nossas perguntas principais se concentram em saber se o Barkour é uma medida eficaz de agilidade, como as estruturas propostas se comparam à agilidade animal e a importância das escolhas de design feitas durante o treinamento das políticas individuais.

Os resultados mostram que o benchmark desafia efetivamente os robôs a demonstrar agilidade, revelando áreas pra melhoria tanto em abordagens de hardware quanto de software.

Impressões dos Experimentos

Nas nossas avaliações, a capacidade do robô de navegar pelo percurso Barkour foi testada várias vezes. Observamos que usar políticas especializadas resultou em uma conclusão bem-sucedida do percurso, embora não sem limitações em velocidade e manobrabilidade.

Achamos que, embora o robô tenha lutado com certos elementos, ele ainda conseguiu realizar muitas tarefas com uma boa taxa de sucesso. Isso levou a insights valiosos sobre a eficácia dos nossos métodos de treinamento e o potencial pra melhorar a agilidade geral dos robôs com patas.

A comparação entre o desempenho do robô e o de cães reais destacou áreas significativas a serem melhoradas. Os cães consistentemente se mostraram mais rápidos e ágeis do que o robô, indicando a necessidade de mais desenvolvimento.

Direções Futuras

Enquanto nosso trabalho estabeleceu uma base forte pra avaliar a agilidade em robôs quadrúpedes, ainda há um espaço considerável pra progresso. O benchmark Barkour não está totalmente resolvido, já que os robôs ainda ficam atrás da agilidade animal real.

As direções de pesquisa futuras incluem usar apenas sensores a bordo ao invés de informações privilegiadas, testar vários designs de robô e modificações de hardware, e explorar configurações interativas semelhantes a eventos reais de agilidade de cães.

Ao continuar refinando o benchmark Barkour e os métodos, esperamos avançar no campo da robótica e ajudar no desenvolvimento de robôs mais ágeis e capazes.

Conclusão

Apresentamos o Barkour como um benchmark pra avaliar a agilidade de robôs quadrúpedes. Ao nos inspirarmos em competições de agilidade de cães, esse benchmark permite um mecanismo de pontuação claro e direto com base em várias habilidades necessárias pra navegar pelo percurso.

Através das nossas duas soluções base, demonstramos que é possível para os robôs aprenderem movimentos ágeis de forma eficaz. Embora nossos métodos mostrem potencial, a diferença entre a agilidade robótica e a animal ressalta a importância de pesquisas contínuas nessa área.

Fonte original

Título: Barkour: Benchmarking Animal-level Agility with Quadruped Robots

Resumo: Animals have evolved various agile locomotion strategies, such as sprinting, leaping, and jumping. There is a growing interest in developing legged robots that move like their biological counterparts and show various agile skills to navigate complex environments quickly. Despite the interest, the field lacks systematic benchmarks to measure the performance of control policies and hardware in agility. We introduce the Barkour benchmark, an obstacle course to quantify agility for legged robots. Inspired by dog agility competitions, it consists of diverse obstacles and a time based scoring mechanism. This encourages researchers to develop controllers that not only move fast, but do so in a controllable and versatile way. To set strong baselines, we present two methods for tackling the benchmark. In the first approach, we train specialist locomotion skills using on-policy reinforcement learning methods and combine them with a high-level navigation controller. In the second approach, we distill the specialist skills into a Transformer-based generalist locomotion policy, named Locomotion-Transformer, that can handle various terrains and adjust the robot's gait based on the perceived environment and robot states. Using a custom-built quadruped robot, we demonstrate that our method can complete the course at half the speed of a dog. We hope that our work represents a step towards creating controllers that enable robots to reach animal-level agility.

Autores: Ken Caluwaerts, Atil Iscen, J. Chase Kew, Wenhao Yu, Tingnan Zhang, Daniel Freeman, Kuang-Huei Lee, Lisa Lee, Stefano Saliceti, Vincent Zhuang, Nathan Batchelor, Steven Bohez, Federico Casarini, Jose Enrique Chen, Omar Cortes, Erwin Coumans, Adil Dostmohamed, Gabriel Dulac-Arnold, Alejandro Escontrela, Erik Frey, Roland Hafner, Deepali Jain, Bauyrjan Jyenis, Yuheng Kuang, Edward Lee, Linda Luu, Ofir Nachum, Ken Oslund, Jason Powell, Diego Reyes, Francesco Romano, Feresteh Sadeghi, Ron Sloat, Baruch Tabanpour, Daniel Zheng, Michael Neunert, Raia Hadsell, Nicolas Heess, Francesco Nori, Jeff Seto, Carolina Parada, Vikas Sindhwani, Vincent Vanhoucke, Jie Tan

Última atualização: 2023-05-23 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2305.14654

Fonte PDF: https://arxiv.org/pdf/2305.14654

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes