Apresentando o SMPLOlympics: Uma Nova Fronteira para Esportes Humanoides
O SMPLOlympics oferece ambientes simulados pra humanos competirem em esportes estilo Olimpíadas, melhorando o aprendizado de movimento.
― 9 min ler
Índice
- Trabalhos Relacionados
- Formulação do Problema
- Aprendizado por Reforço Condicionado por Objetivo para Controle Humanoide
- SMPLOlympics: Ambientes Esportivos para Humanoides Simulados
- Aquisição de Demonstrações Humanas de Vídeos
- Detalhes de Implementação
- Baselines
- Métricas
- Benchmarking de Algoritmos Simulados Populares para Humanoides
- Limitações, Conclusão e Trabalhos Futuros
- Fonte original
- Ligações de referência
Apresentamos uma coleção de ambientes onde humanoides podem participar de vários Esportes olímpicos, chamada SMPLOlympics. Esses ambientes permitem que atletas virtuais compitam, ajudando pesquisadores a testar e melhorar seus algoritmos que ensinam máquinas a se moverem como humanos. Como os humanos praticam esses esportes há muito tempo, existe muita informação sobre como se sair bem neles. Nossos modelos de humanoides são projetados para trabalhar com modelos populares do corpo humano da área de gráficos, facilitando a aplicação de Movimentos humanos existentes em nossos atletas virtuais.
No SMPLOlympics, oferecemos tanto esportes individuais, como golfe, lançamento de dardo, salto em altura, salto em distância e corrida de obstáculos, quanto esportes competitivos, como tênis de mesa, tênis, esgrima, boxe, futebol e basquete. Descobrimos que, se combinarmos movimentos fortes aprendidos com performances humanas com formas simples de recompensar os humanoides, conseguimos ver comportamentos neles que se parecem com como os humanos jogam esses esportes.
Criar esses ambientes esportivos simulados não é fácil. Muitas tentativas no passado focaram principalmente em tarefas básicas de andar ou correr, que são mais simples para os humanoides aprenderem. No entanto, essas simulações anteriores não aproveitaram totalmente a complexidade e variedade que vêm dos movimentos esportivos, o que pode levar a comportamentos mais interessantes e avançados.
Um benefício importante de trabalhar com simulações de humanoides é a capacidade de obter facilmente movimentos humanos para Treinamento. Como os humanoides parecem pessoas, é fácil entender os movimentos que estão fazendo. Podemos usar vídeos ou dados de captura de movimento para reunir esses movimentos humanos, que são cruciais para melhorar nossos atletas virtuais.
Neste trabalho, apresentamos o SMPLOlympics, um conjunto variado de ambientes simulados onde humanoides podem competir em esportes olímpicos. Esta coleção não só desafia os humanoides em movimento, mas também em coordenação e tomada de decisões. Com os designs dos nossos humanoides alinhados a modelos humanos populares, podemos converter movimentos humanos diretamente em nossas simulações. Em situações onde os movimentos das mãos são essenciais, usamos o modelo de humanoide SMPL-X. Para outras tarefas, o modelo SMPL é suficiente.
Nossos ambientes esportivos atendem tanto esportes individuais quanto em equipe, proporcionando uma ampla plataforma para avaliação e benchmarking. Para os esportes individuais, temos golfe, lançamento de dardo, salto em altura, salto em distância e corrida de obstáculos. Nos esportes em equipe, incluímos jogos um-a-um, como pingue-pongue, tênis, esgrima e boxe, além de jogos em equipe como futebol e basquete. Para tornar mais fácil medir o sucesso, também incluímos tarefas mais simples, como cobranças de pênalti no futebol ou acertos de alvo em pingue-pongue e tênis.
Para mostrar como os movimentos humanos podem melhorar a performance, extraímos dados de movimento de vídeos e aplicamos aos nossos humanoides. Isso ajuda nossos atletas simulados a se moverem de uma forma mais parecida com a humana, tornando os resultados mais realistas. Também analisamos como os avanços recentes na representação de movimentos podem melhorar o controle dos nossos humanoides através do aprendizado.
Trabalhos Relacionados
Esportes Humanoides Simulados
Usar esportes humanoides simulados pode ajudar a criar animações e encontrar melhores estratégias para esses esportes. Pesquisas anteriores se concentraram principalmente em esportes individuais em simulações, incluindo tênis, tênis de mesa, boxe, esgrima, basquete e futebol. Esses estudos tinham como objetivo imitar movimentos humanos usando dados disponíveis. No entanto, diferentes designs de humanoides dificultam a combinação eficaz dos dados de movimento humano. Nossa abordagem com o SMPLOlympics cria um ambiente unificado, permitindo comparações mais fáceis entre métodos de aprendizado em diferentes esportes.
Benchmarks de Aprendizado por Reforço Simulado
Os humanoides simulados também oferecem uma oportunidade valiosa para estudar movimentos inteligentes porque se parecem com ações humanas reais. A maioria dos benchmarks atuais se concentra em tarefas simples, como andar ou superar obstáculos. Em contraste, o SMPLOlympics oferece oportunidades para esportes competitivos, que exigem movimentos mais ágeis e trabalho em equipe. Esses elementos são altamente visíveis e permitem medições claras de desempenho.
Formulação do Problema
Descrevemos os movimentos do humanoide usando um método específico que representa as posições e orientações de articulações em 3D. Ao fazer isso, também incluímos as velocidades desses movimentos para um controle preciso. Quando objetos estão envolvidos, como um dardo ou uma bola de futebol, monitoramos como eles se movem em relação ao humanoide.
Aprendizado por Reforço Condicionado por Objetivo para Controle Humanoide
Configuramos cada esporte usando aprendizado por reforço condicionado por objetivo. Uma política é treinada para gerenciar as ações de um humanoide em um ambiente esportivo. O treinamento é estruturado em um sistema de estados, ações, transições de movimento, Recompensas e outros fatores. Este método ajuda o humanoide a aprender a realizar suas tarefas esportivas designadas.
SMPLOlympics: Ambientes Esportivos para Humanoides Simulados
Nesta seção, vamos detalhar como cada esporte no SMPLOlympics é estruturado, desde eventos individuais até atividades em equipe. Além disso, discutiremos como reunimos dados de movimento humano a partir de vídeos. Cada esporte vem com seu próprio design de recompensa, criando um ponto de partida para desenvolvimento futuro.
Esportes para Uma Pessoa
Salto em Altura: No evento de salto em altura, o humanoide deve pular sobre uma barra definida em uma certa altura sem tocá-la e deve alcançar um ponto objetivo atrás da barra. A barra é ajustada como nas competições oficiais. Recompensas são dadas por se aproximar do objetivo e por saltar mais alto.
Salto em Distância: No salto em distância, o humanoide tem uma pista de 20 metros para ganhar velocidade antes de saltar. Deve decolar da linha de salto, e as recompensas são dadas com base na distância do salto, assim como na velocidade antes do salto.
Corrida de Obstáculos: No evento de corrida de obstáculos, um humanoide corre 110 metros enquanto salta sobre dez barreiras. O humanoide recebe recompensas por correr em direção à linha de chegada e por superar cada obstáculo. A altura dos obstáculos é ajustada aleatoriamente para criar diversos desafios.
Golfe: O humanoide usa um taco de golfe para acertar uma bola em direção a um alvo. O ambiente imita gramados reais, e o humanoide é recompensado por acertar a bola para frente, fazer contato com o taco e colocar a bola no buraco.
Lançamento de Dardo: No lançamento de dardo, usamos um humanoide com dedos articulados. O objetivo do humanoide é lançar o dardo o mais longe possível, e ele recebe recompensas por segurar o dardo, lançá-lo com precisão e manter estabilidade durante o lançamento.
Esportes para Mais Pessoas
Tênis: Cada humanoide é equipado com uma raquete para acertar uma bola. Existem sessões de prática solo e partidas competitivas um-a-um. O humanoide é recompensado por se aproximar da bola e acertá-la com precisão em direção a um alvo.
Tênis de Mesa: Semelhante ao tênis, o humanoide usa uma pá para bater na bola em uma mesa de tamanho padrão. Há tanto tarefas solo quanto competitivas, e o humanoide recebe recompensas por acertos bem-sucedidos.
Esgrima: Em um duelo de esgrima, cada humanoide empunha uma espada. As recompensas incluem enfrentar o oponente, mover-se em direção a ele e fazer contato com o alvo.
Boxe: Na configuração de boxe, os humanoides lutam em um ringue usando suas mãos aprimoradas. O treinamento é semelhante ao da esgrima, com recompensas estruturadas para movimento e contato.
Futebol: No futebol, os humanoides podem participar de cobranças de pênalti ou partidas em equipe. Para cobranças de pênalti, o humanoide tenta chutar a bola em um gol. Na jogada em equipe, a cooperação com os companheiros é incentivada e recompensada.
Basquete: Este ambiente imita uma quadra de basquete onde os humanoides precisam tentar fazer uma cesta. Os humanoides aprendem a lançar a bola sem tocá-la com os pés.
Nos esportes competitivos, habilitamos um mecanismo básico de auto-jogo, onde duas políticas se enfrentam, ajudando cada uma a melhorar suas estratégias.
Aquisição de Demonstrações Humanas de Vídeos
Para reunir demonstrações de movimento humano, utilizamos métodos avançados que reconstrõem movimentos 3D a partir de filmagens. Esses sistemas podem rastrear movimentos mesmo em ambientes dinâmicos, como transmissões esportivas. Os dados coletados são usados para guiar os movimentos dos humanoides, garantindo que permaneçam realistas e fisicamente plausíveis.
Detalhes de Implementação
A simulação ocorre em um ambiente especializado que roda em certas velocidades. Os humanoides usados têm estruturas articulares específicas, com medições detalhadas para seus movimentos. O processo de treinamento para os humanoides pode ser concluído em alguns dias usando hardware projetado para processar algoritmos complexos. Cada articulação tem limitações para manter movimentos realistas.
Baselines
Testamos nossos esportes simulados usando alguns dos métodos de controle mais recentes para humanoides. Cada tarefa é treinada usando diferentes abordagens, e observamos o desempenho de vários métodos em nossos ambientes esportivos.
Métricas
Medimos o sucesso com base em tarefas facilmente quantificáveis, como saltos, lançamentos e gols. Cada tarefa é avaliada em várias tentativas, coletando métricas que fornecem insights sobre a qualidade do desempenho.
Benchmarking de Algoritmos Simulados Populares para Humanoides
Avaliamo e comparamos vários métodos de controle para ver quão bem eles se desempenham em diferentes esportes. Ao examinarmos os resultados, podemos determinar quais métodos são mais eficazes para ensinar humanoides a realizar tarefas esportivas.
Limitações, Conclusão e Trabalhos Futuros
Embora o SMPLOlympics ofereça múltiplos ambientes esportivos, vários esportes populares não foram incluídos devido a desafios em simular. Nossos designs iniciais de recompensa podem ser aprimorados para produzir resultados ainda melhores, especialmente em esportes coletivos competitivos.
Em resumo, o SMPLOlympics apresenta um conjunto abrangente de ambientes simulados para humanoides se envolverem em esportes. Com um design cuidadoso e forte orientação de movimento humano, esses humanoides podem alcançar performances impressionantes em várias tarefas esportivas. Essa estrutura prepara o caminho para uma compreensão física mais avançada e desenvolvimento de comportamentos de humanoides no futuro.
No apêndice, fornecemos detalhes adicionais sobre nossos ambientes, incluindo designs específicos para recompensas e métodos de treinamento. Resultados qualitativos abrangentes podem ser acessados, mostrando o que foi alcançado nesses ambientes esportivos e os resultados de treinamento baseados em nossos designs iniciais.
Título: SMPLOlympics: Sports Environments for Physically Simulated Humanoids
Resumo: We present SMPLOlympics, a collection of physically simulated environments that allow humanoids to compete in a variety of Olympic sports. Sports simulation offers a rich and standardized testing ground for evaluating and improving the capabilities of learning algorithms due to the diversity and physically demanding nature of athletic activities. As humans have been competing in these sports for many years, there is also a plethora of existing knowledge on the preferred strategy to achieve better performance. To leverage these existing human demonstrations from videos and motion capture, we design our humanoid to be compatible with the widely-used SMPL and SMPL-X human models from the vision and graphics community. We provide a suite of individual sports environments, including golf, javelin throw, high jump, long jump, and hurdling, as well as competitive sports, including both 1v1 and 2v2 games such as table tennis, tennis, fencing, boxing, soccer, and basketball. Our analysis shows that combining strong motion priors with simple rewards can result in human-like behavior in various sports. By providing a unified sports benchmark and baseline implementation of state and reward designs, we hope that SMPLOlympics can help the control and animation communities achieve human-like and performant behaviors.
Autores: Zhengyi Luo, Jiashun Wang, Kangni Liu, Haotian Zhang, Chen Tessler, Jingbo Wang, Ye Yuan, Jinkun Cao, Zihui Lin, Fengyi Wang, Jessica Hodgins, Kris Kitani
Última atualização: 2024-06-28 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.00187
Fonte PDF: https://arxiv.org/pdf/2407.00187
Licença: https://creativecommons.org/licenses/by-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.