Simple Science

Ciência de ponta explicada de forma simples

# Informática# Robótica

Avanços nas técnicas de corrida de carros autônomos

Novos métodos melhoram a performance de corrida de carros autônomos usando deep learning.

― 8 min ler


Robôs de Corrida: UmaRobôs de Corrida: UmaNova Estratégiamais rápido e seguro.carros autônomos pra ter um desempenhoDeep learning transforma corridas de
Índice

Corrida de carros autônomos é um campo fascinante onde robôs competem para terminar uma corrida o mais rápido possível. Nos métodos tradicionais, esses carros dependem de rastreamento de localização preciso para seguir um caminho definido. No entanto, uma abordagem mais nova usa programas de computador inteligentes para ensinar os carros a correrem usando dados brutos dos Sensores em vez de rotas pré-planejadas. Este artigo discute uma nova forma de treinar carros autônomos para correr em alta velocidade enquanto permanecem seguros na pista.

Como Funciona a Corrida Tradicional

Na corrida clássica de carros autônomos, os carros são guiados por um caminho planejado, calculado com antecedência, que diz como navegar na pista. Eles se baseiam em sensores para determinar sua localização em um mapa, o que permite que sigam o caminho de forma eficiente. O objetivo é terminar a corrida o mais rápido possível.

O método precisa de um mapeamento preciso do ambiente e, muitas vezes, os carros dependem de múltiplos sensores como GPS e câmeras para coletar informações sobre os arredores. Essa dependência torna desafiador se adaptar a pistas novas ou não marcadas, já que o carro precisa ter uma rota pré-definida para seguir.

Para correr com sucesso, os motoristas precisam equilibrar velocidade e controle. Ir rápido demais pode levar a batidas, enquanto ir devagar resulta em mau desempenho. Os sistemas tradicionais usam algoritmos para calcular os melhores comandos de controle que ajudam os carros a navegar na pista de forma mais eficaz.

Indo Além dos Métodos Tradicionais

Em contraste, a nova abordagem usa técnicas de aprendizado profundo. Em vez de depender de caminhos programados, uma rede neural processa dados brutos de sensores como LiDAR- uma tecnologia que usa lasers para criar um mapa 3D do ambiente. O sistema de aprendizado profundo aprende com experiências para tomar decisões que maximizam o desempenho com base no feedback que recebe durante as corridas.

Os métodos tradicionais de corrida costumam ter bom desempenho em altas velocidades, mas requerem rastreamento de localização preciso. Os métodos de aprendizado profundo são mais flexíveis e podem operar sem precisar de um mapa detalhado. No entanto, tentativas anteriores usando esses métodos muitas vezes resultaram em desempenho inferior durante as corridas, especialmente em altas velocidades devido à falta de consideração sobre quão rápido o carro deve ir em diferentes situações.

Introduzindo o Aprendizado Assistido por Trajetória

Essa nova técnica, chamada aprendizado assistido por trajetória, busca combinar as forças dos métodos tradicionais e do aprendizado profundo. Ao integrar informações sobre a melhor linha de corrida com o processo de aprendizado, o carro pode aprender a correr mais rápido e de forma mais eficaz. A linha de corrida é o caminho ideal ao redor da pista, levando em conta onde acelerar e onde desacelerar.

O sistema de aprendizado usa um algoritmo especializado para treinar o carro usando dados da linha de corrida enquanto ainda processa informações brutas dos sensores. Testes mostram que essa abordagem permite que os carros completem voltas com mais sucesso em altas velocidades do que outros métodos.

Por Que Corrida é um Bom Teste para Carros Autônomos

As corridas apresentam um excelente ambiente para testar algoritmos autônomos de alto desempenho porque a natureza competitiva exige decisões rápidas e envolve métricas de desempenho claras, como quanto tempo leva para terminar uma volta. Usando sensores, o objetivo é calcular os melhores comandos de controle para o carro navegar o mais rápido possível.

Correr exige que os carros operem nos limites de sua velocidade e controle. Se vão rápido demais, batem; se vão devagar demais, perdem. Isso cria um desafio complexo para qualquer sistema autônomo.

Entendendo o Processo de Aprendizado

O novo método de treinar os carros envolve um processo onde um algoritmo de Aprendizado por Reforço Profundo melhora as habilidades de tomada de decisão do carro. Esse sistema aprende através de tentativa e erro, aprimorando suas ações com base em como o carro se sai em cada corrida.

O algoritmo de aprendizado profundo consiste em duas partes principais: um ator, que escolhe as ações com base na situação atual, e um crítico, que avalia quão boas são essas ações. À medida que o carro pratica a corrida, ele coleta experiências que ajudam a atualizar sua compreensão e melhorar seu desempenho.

Formulações de Aprendizado para Melhoria

Ao usar técnicas de aprendizado inteligentes, o sistema visa melhorar o quão bem o carro pode correr em altas velocidades. Especificamente, isso significa ensinar o carro a ajustar sua velocidade apropriadamente em diferentes partes da pista.

O processo de treinamento envolve configurar um sistema de recompensas onde o carro ganha pontos por completar voltas e perde pontos por bater. Ajustar o sistema de recompensas ajuda a garantir que o carro aprenda a dirigir mais rápido enquanto também segue a melhor linha de corrida.

Testando o Novo Método de Aprendizado

Para avaliar essa nova abordagem, testes são realizados usando vários mapas de corrida em um simulador projetado para veículos autônomos. O simulador cria um ambiente controlado para treinamento onde o carro responde ao seu entorno usando dados de LiDAR, permitindo um aprendizado mais rápido e seguro.

Durante os testes, os carros usando o método de aprendizado assistido por trajetória mostraram uma maior taxa de sucesso em completar voltas em comparação com métodos tradicionais. Isso indica que a nova abordagem é mais eficaz para treinar em altas velocidades.

Comparação de Desempenho em Corridas

Como parte da avaliação, duas estratégias principais são comparadas: a linha de base tradicional, que segue um caminho central sem considerar velocidade, e a nova abordagem assistida por trajetória, que incorpora ajustes de velocidade.

O novo método de aprendizado superou consistentemente o método básico em termos de taxas de conclusão de voltas e perfis de velocidade. Isso sugere que os carros treinados com aprendizado assistido por trajetória lidam melhor com a pista, especialmente nas curvas onde o controle de velocidade é crucial.

Vantagens do Aprendizado Assistido por Trajetória

A introdução do aprendizado assistido por trajetória oferece vários benefícios:

  1. Taxas de Sucesso Mais Altas: Carros treinados usando esse método completaram mais voltas com sucesso em altas velocidades em comparação com aqueles que dependem apenas de métodos tradicionais.

  2. Melhor Controle de Velocidade: Os carros aprenderam a ajustar suas velocidades adequadamente para diferentes seções da pista, particularmente desacelerando em curvas mais fechadas e acelerando novamente em retas.

  3. Eficiência de Treinamento: O novo método permite melhor uso do tempo de treinamento, ajudando os carros a aprenderem a navegar de forma eficaz em menos sessões.

  4. Robustez em Diferentes Pistas: A abordagem de aprendizado provou ser bem-sucedida em vários mapas de corrida, demonstrando versatilidade e adaptabilidade no desempenho.

Olhando Para o Futuro

À medida que o campo das corridas autônomas continua a evoluir, fica claro que métodos que combinam técnicas tradicionais com aprendizado de máquina moderno oferecem um futuro promissor para corridas de alto desempenho. Pesquisas futuras podem explorar como essas melhorias se traduzem em aplicações do mundo real, possivelmente ajustando para as complexidades de lidar com carros físicos.

Além disso, essas técnicas podem se estender além das corridas para outras áreas, como controle de drones, onde caminhos ideais são igualmente importantes. O objetivo fundamental permanece o mesmo: desenvolver sistemas autônomos mais inteligentes e capazes que empurrem os limites da tecnologia enquanto garantem segurança e desempenho.

Conclusão

Em resumo, o desenvolvimento do aprendizado assistido por trajetória representa um avanço significativo na busca por corridas de carros autônomos em alta velocidade. Ao fundir efetivamente técnicas clássicas com aprendizado profundo avançado, essa abordagem inovadora mostrou desempenho superior, melhor gerenciamento de velocidade e taxas de conclusão de voltas mais altas em cenários de corrida. À medida que a pesquisa avança, as aplicações potenciais desses métodos podem se estender a uma variedade de sistemas autônomos, abrindo caminho para tecnologias autônomas mais seguras e eficientes no futuro.

Fonte original

Título: High-speed Autonomous Racing using Trajectory-aided Deep Reinforcement Learning

Resumo: The classical method of autonomous racing uses real-time localisation to follow a precalculated optimal trajectory. In contrast, end-to-end deep reinforcement learning (DRL) can train agents to race using only raw LiDAR scans. While classical methods prioritise optimization for high-performance racing, DRL approaches have focused on low-performance contexts with little consideration of the speed profile. This work addresses the problem of using end-to-end DRL agents for high-speed autonomous racing. We present trajectory-aided learning (TAL) that trains DRL agents for high-performance racing by incorporating the optimal trajectory (racing line) into the learning formulation. Our method is evaluated using the TD3 algorithm on four maps in the open-source F1Tenth simulator. The results demonstrate that our method achieves a significantly higher lap completion rate at high speeds compared to the baseline. This is due to TAL training the agent to select a feasible speed profile of slowing down in the corners and roughly tracking the optimal trajectory.

Autores: Benjamin David Evans, Herman Arnold Engelbrecht, Hendrik Willem Jordaan

Última atualização: 2023-06-12 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.07003

Fonte PDF: https://arxiv.org/pdf/2306.07003

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes