ROAD-Waymo: Um Novo Conjunto de Dados para Carros Autônomos
ROAD-Waymo melhora a compreensão das ações na estrada para veículos autônomos.
Salman Khan, Izzeddin Teeti, Reza Javanmard Alitappeh, Mihaela C. Stoian, Eleonora Giunchiglia, Gurkirt Singh, Andrew Bradley, Fabio Cuzzolin
― 7 min ler
Índice
- O que é o ROAD-Waymo?
- A Necessidade de Conjuntos de Dados Maiores
- Características do Conjunto de Dados
- Como é Diferente dos Conjuntos de Dados Anteriores?
- Desafios com as Tecnologias Atuais
- O Que Compõe o Conjunto de Dados?
- Processo de Anotação
- Importância do Conjunto de Dados
- Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
Os carros autônomos precisam fazer mais do que apenas ver a estrada. Eles também precisam entender o que tá rolando ao redor. Isso é crucial pra dirigir com segurança entre outros veículos, ciclistas e pedestres. Mas aqui vai a pegadinha: não existem muitos Conjuntos de dados, que são essenciais pra treinar esses carros, focando em entender as Ações de outros usuários da estrada.
A maioria dos conjuntos de dados existentes é pequena e geralmente limitada a só uma cidade. Carros autônomos, no entanto, precisam estar preparados pra dirigir em vários ambientes e situações. Este artigo apresenta um novo conjunto de dados chamado ROAD-Waymo, feito pra desenvolver e testar técnicas de detecção de ações e eventos em cenas de trânsito.
O que é o ROAD-Waymo?
ROAD-Waymo é uma baita coleção de dados que visa ajudar os carros autônomos a entender melhor o que tá acontecendo na estrada. Ele se destaca porque tem uma quantidade enorme de quadros de vídeo e rótulos que descrevem o que tá rolando nas cenas. Esse conjunto de dados é muito maior e mais complexo do que os esforços anteriores, cobrindo várias cidades e diversos cenários.
Com mais de 198.000 quadros de vídeo anotados, 54.000 trajetórias de Agentes, 3,9 milhões de caixas delimitadoras e um total de 12,4 milhões de rótulos, tem o potencial de melhorar seriamente como os carros autônomos aprendem a interagir com o mundo ao redor deles.
A Necessidade de Conjuntos de Dados Maiores
A tecnologia atual de carros autônomos depende bastante de sistemas de percepção, que permitem que o veículo identifique e entenda o que tá ao seu redor. Muitos conjuntos de dados focam principalmente em detectar objetos como carros e pedestres, mas pra garantir a segurança, os carros autônomos também precisam entender as ações dessas entidades.
Conjuntos de dados anteriores como o ROAD foram bons pontos de partida, mas eram limitados em tamanho e diversidade. O ROAD-Waymo tem a intenção de preencher essa lacuna, oferecendo informações mais abrangentes que podem ajudar os carros autônomos a operar com segurança em diferentes ambientes.
Características do Conjunto de Dados
ROAD-Waymo oferece várias características-chave que o tornam especial:
-
Escala: Esse conjunto de dados é gigante, com muitos mais rótulos de ações do que os conjuntos anteriores. É oito vezes maior do que os anteriores, o que significa mais oportunidades de aprendizado para os carros autônomos.
-
Multi-Cidade: Inclui dados de diferentes cidades nos EUA, permitindo capturar vários cenários de direção. Essa diversidade é vital, já que as condições de direção podem mudar dramaticamente de um lugar pra outro.
-
Complexidade: Os rótulos são ricos em detalhes. Eles cobrem uma ampla gama de ações para diferentes tipos de usuários da estrada, o que significa que os carros autônomos podem aprender com as complexidades do mundo real, em vez de cenários simplificados.
-
Anotações Verificadas: O conjunto de dados vem com anotações que foram cuidadosamente verificadas pra garantir que atendam a certos padrões. Isso reduz as chances de erros que podem confundir o processo de aprendizado.
-
Estrutura para Testes: O novo conjunto de dados ROAD-Waymo permite que os pesquisadores comparem seus métodos entre si. Isso vai ajudar a acelerar o desenvolvimento pra tornar os carros autônomos mais seguros e eficientes.
Como é Diferente dos Conjuntos de Dados Anteriores?
Anteriormente, muitos conjuntos de dados focavam apenas na detecção de objetos, que é só identificar e localizar objetos na cena. O ROAD-Waymo vai um passo além, fornecendo insights sobre as ações que estão sendo realizadas por esses objetos.
Por exemplo, em vez de apenas notar que um carro tá presente, o conjunto de dados também registra se ele tá se movendo, virando ou parando. Isso significa que os carros autônomos podem ser treinados pra reconhecer e prever o comportamento de outros usuários da estrada, permitindo uma navegação mais segura.
Desafios com as Tecnologias Atuais
Os carros autônomos são como crianças pequenas aprendendo a andar; eles podem tropeçar facilmente se não prestarem atenção. O verdadeiro desafio tá em como esses veículos se adaptam a ambientes que mudam.
Por exemplo, se um carro aprende a operar bem em tempo ensolarado, pode ter dificuldade quando enfrenta chuva ou neblina. Da mesma forma, um carro treinado em um país pode ter dificuldade em entender as regras e padrões de trânsito em outro. O ROAD-Waymo foi feito pra enfrentar esses desafios, fornecendo um conjunto de cenários de treinamento mais diversificado.
O Que Compõe o Conjunto de Dados?
O conjunto de dados é rico em várias anotações que fornecem uma imagem clara do ambiente. Cada usuário da estrada é anotado com três rótulos:
-
Agente: Esse rótulo descreve qual tipo de objeto tá presente, como um carro, ciclista ou pedestre.
-
Ação: Esse rótulo indica o que o agente tá fazendo, como se movendo, parando ou virando.
-
Localização: Esse rótulo especifica onde a ação tá acontecendo, como numa faixa, em um cruzamento ou na calçada.
Esses rótulos detalhados permitem que os carros autônomos construam um mapa mental mais completo do ambiente ao redor.
Anotação
Processo deCriar um conjunto de dados assim é um pouco como organizar uma grande festa-muito planejamento e coordenação são necessários. O processo de anotação foi metódico e envolveu rastrear os objetos nas cenas de vídeo e rotulá-los com precisão.
Em vez de começar do zero, a equipe usou estruturas de dados existentes e adicionou suas próprias anotações. Essa abordagem acelerou o processo e garantiu consistência. Além disso, eles aplicaram checagens pra verificar que cada rótulo atendia a certos critérios de bom senso, reduzindo a chance de erros.
Importância do Conjunto de Dados
Com os avanços rápidos na tecnologia de carros autônomos, a necessidade de materiais de aprendizado melhores é urgente. O ROAD-Waymo serve não só como uma ferramenta de treinamento, mas também como um parâmetro pra comparar diferentes estratégias e técnicas na pesquisa de veículos autônomos.
Como é compatível com conjuntos de dados anteriores, oferece aos pesquisadores uma chance de explorar como seus métodos podem se adaptar a diferentes condições. A integração da lógica do bom senso no processo de verificação também garante que o aprendizado não se baseie apenas em dados, mas guiado por uma compreensão prática.
Direções Futuras
À medida que a tecnologia de carros autônomos continua a evoluir, a necessidade de conjuntos de dados refinados também vai aumentar. O ROAD-Waymo é só o começo. Expansões futuras poderiam incluir condições climáticas mais diversas, diferentes tipos de dados de sensores e até mesmo mapeamento 3D pra aprimorar ainda mais o processo de treinamento.
A longo prazo, a meta é criar carros autônomos que não sejam apenas reativos, mas capazes de respostas antecipatórias. Seja prevendo o próximo movimento de um pedestre ou entendendo sinais de trânsito em diferentes idiomas, as aplicações potenciais para esse conjunto de dados são enormes.
Conclusão
Em conclusão, o ROAD-Waymo é um passo significativo na busca pra tornar os carros autônomos mais seguros e confiáveis. Com sua grande escala, anotações ricas e um processo de verificação minucioso, oferece um recurso valioso pra pesquisadores que buscam avançar na compreensão da direção autônoma.
Enfrentando desafios chave em percepção e consciência de ações, podemos em breve ver carros autônomos que não apenas seguem regras, mas também entendem o mundo ao redor deles. E quem sabe? Talvez um dia eles aprendam a nos levar pra praia sem precisar de supervisão constante.
Enquanto isso, só podemos torcer pra que eles não se distraiam com objetos brilhantes-ou um cachorro correndo atrás de um esquilo!
Título: ROAD-Waymo: Action Awareness at Scale for Autonomous Driving
Resumo: Autonomous Vehicle (AV) perception systems require more than simply seeing, via e.g., object detection or scene segmentation. They need a holistic understanding of what is happening within the scene for safe interaction with other road users. Few datasets exist for the purpose of developing and training algorithms to comprehend the actions of other road users. This paper presents ROAD-Waymo, an extensive dataset for the development and benchmarking of techniques for agent, action, location and event detection in road scenes, provided as a layer upon the (US) Waymo Open dataset. Considerably larger and more challenging than any existing dataset (and encompassing multiple cities), it comes with 198k annotated video frames, 54k agent tubes, 3.9M bounding boxes and a total of 12.4M labels. The integrity of the dataset has been confirmed and enhanced via a novel annotation pipeline designed for automatically identifying violations of requirements specifically designed for this dataset. As ROAD-Waymo is compatible with the original (UK) ROAD dataset, it provides the opportunity to tackle domain adaptation between real-world road scenarios in different countries within a novel benchmark: ROAD++.
Autores: Salman Khan, Izzeddin Teeti, Reza Javanmard Alitappeh, Mihaela C. Stoian, Eleonora Giunchiglia, Gurkirt Singh, Andrew Bradley, Fabio Cuzzolin
Última atualização: 2024-11-08 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2411.01683
Fonte PDF: https://arxiv.org/pdf/2411.01683
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.pamitc.org/documents/mermin.pdf
- https://support.apple.com/en-ca/guide/preview/prvw11793/mac#:~:text=Delete%20a%20page%20from%20a,or%20choose%20Edit%20%3E%20Delete
- https://www.adobe.com/acrobat/how-to/delete-pages-from-pdf.html#:~:text=Choose%20%E2%80%9CTools%E2%80%9D%20%3E%20%E2%80%9COrganize,or%20pages%20from%20the%20file
- https://superuser.com/questions/517986/is-it-possible-to-delete-some-pages-of-a-pdf-document
- https://www.computer.org/about/contact
- https://ctan.org/pkg/axessibility?lang=en
- https://www.tesladeaths.com/
- https://neurips.cc/Conferences/2023/PaperInformation/FundingDisclosure
- https://arxiv.org/pdf/1803.09010.pdf
- https://www.cs.toronto.edu/~kriz/cifar.html
- https://paperswithcode.com/datasets/license
- https://developers.google.com/search/docs/data-types/dataset
- https://arxiv.org/pdf/2106.11118.pdf
- https://arxiv.org/pdf/2301.00493.pdf
- https://arxiv.org/pdf/2106.11037.pdf
- https://sites.google.com/view/roadchallangeiccv2021/challenge
- https://sites.google.com/view/road-plus-plus/home
- https://github.com/salmank255/Road-waymo-dataset
- https://github.com/salmank255/ROAD_Waymo_Baseline
- https://export.arxiv.org/pdf/2102.11585
- https://minisat.se
- https://waymo.com/open/data/perception/
- https://www.nuscenes.org/
- https://www.cs.columbia.edu/~vondrick/vatic/
- https://github.com/Microsoft/VoTT/
- https://www.mathworks.com/products/automated-driving.html