F1TENTH: Avances en Carreras Autónomas
Una mirada a la plataforma F1TENTH y su impacto en la investigación sobre carreras autónomas.
― 8 minilectura
Tabla de contenidos
- El desafío de las carreras autónomas
- Encuesta de enfoques actuales
- Métodos Clásicos
- Métodos Basados en Aprendizaje
- Entendiendo los componentes clave
- Localización por Filtros de Partículas
- Optimización de Trayectorias
- Control Predictivo de Modelos (MPC)
- Método de Seguir el Espacio
- Aprendizaje de Extremo a Extremo
- Evaluación de Puntos de Referencia y Resultados
- Error de Localización
- Configuración de Entrenamiento
- Resultados de Puntos de Referencia
- Direcciones Futuras
- Carreras Basadas en Visión
- Carreras de Pilas Completa
- Robustez del Aprendizaje de Extremo a Extremo
- Transferencia de Simulación a Realidad
- Soluciones Sin Mapa
- Carreras Multi-Agente
- Conclusión
- Fuente original
- Enlaces de referencia
F1TENTH es una plataforma de carreras a pequeña escala que usa coches teledirigidos a escala 1:10. Se ha vuelto popular para la investigación en robótica y sistemas autónomos. Esta plataforma permite a los investigadores desarrollar y probar métodos para coches autónomos en un entorno competitivo. Los desafíos de las carreras incluyen moverse rápido por una pista mientras toman decisiones basadas en datos de sensores, lo que presenta una oportunidad única para avanzar en el campo.
La tecnología usada en F1TENTH varía desde métodos tradicionales hasta técnicas modernas de aprendizaje automático. La variedad de enfoques ha llevado a un campo fragmentado donde comparar diferentes métodos es complicado. Para abordar este problema, nuestro objetivo es dar claridad y unidad en la investigación de F1TENTH revisando métodos actuales, compartiendo rendimientos y proporcionando puntos de referencia para futuros estudios.
El desafío de las carreras autónomas
En las carreras autónomas, el objetivo principal es que el vehículo elija las mejores acciones, como velocidad y dirección, para navegar la pista de manera rápida y segura. Correr trae su propio conjunto de desafíos, como la dinámica de los neumáticos que puede cambiar bajo diferentes condiciones, datos de sensores que pueden ser desordenados, y la necesidad de decisiones rápidas en un tiempo limitado.
Un conflicto clave en las carreras es entre ir lo más rápido posible y asegurarse de que el vehículo siga siendo seguro. Si el vehículo acelera demasiado, corre el riesgo de chocar. Por otro lado, ser demasiado cauteloso puede llevar a tiempos de vuelta más lentos. Este acto de equilibrio impulsa la necesidad de mejores algoritmos que puedan lograr un alto rendimiento sin comprometer la seguridad.
La plataforma F1TENTH es atractiva para los investigadores porque permite probar nuevas ideas de manera rápida y eficiente. Los coches están equipados con sensores que les ayudan a detectar su entorno, y tienen computadoras a bordo que pueden procesar los datos en tiempo real, facilitando la implementación de nuevas estrategias.
Encuesta de enfoques actuales
En nuestra exploración de las carreras F1TENTH, categorizamos los diversos enfoques en métodos clásicos y basados en aprendizaje.
Métodos Clásicos
Los métodos clásicos dependen de estimaciones, optimizaciones y sistemas de control para producir comandos de conducción. Esto generalmente significa primero localizar el vehículo en un mapa, luego planificar una ruta y, finalmente, seguir esa ruta mientras se corre.
La Localización implica construir un mapa y determinar dónde está el vehículo en cualquier momento. Aunque existen técnicas para crear mapas, muchos investigadores usan herramientas existentes que funcionan bien con las carreras F1TENTH.
Una vez que el vehículo está localizado, se puede empezar la planificación de trayectorias. Esto puede hacerse fuera de línea, donde se crea un camino óptimo de antemano, o en línea, donde el camino se ajusta durante la carrera.
Los métodos de control implican generar comandos para la velocidad y dirección para asegurar que el vehículo siga el camino planeado. El algoritmo de control más común utilizado es el de búsqueda pura, donde el vehículo apunta a girar hacia un punto de anticipación.
Métodos Basados en Aprendizaje
Los métodos de aprendizaje utilizan redes neuronales para gestionar parte o la totalidad del pipeline de carreras. Estos enfoques varían ampliamente según la arquitectura utilizada, los algoritmos de entrenamiento y las señales de recompensa que guían el proceso de aprendizaje.
Una estrategia es el Aprendizaje de extremo a extremo, donde una red neuronal procesa datos de sensores y emite directamente controles para velocidad y dirección. Otra es la planificación, donde el sistema aprende a usar la ubicación actual del vehículo para tomar mejores decisiones de conducción.
El aprendizaje de política residual añade una nueva capa a las políticas de control existentes para mejorar su rendimiento. Por ejemplo, puede mejorar algoritmos estándar para hacerlos más robustos en situaciones de carrera.
El aprendizaje seguro se centra en garantizar la seguridad durante el entrenamiento, lo que hace posible desplegar sistemas en entornos del mundo real sin asumir riesgos excesivos.
Entendiendo los componentes clave
Localización por Filtros de Partículas
El filtro de partículas es un método común para estimar la posición del vehículo. Funciona usando múltiples "partículas" para representar posibles ubicaciones del coche basándose en lecturas de sensores. Con el tiempo, estas partículas se ajustan a medida que llegan más datos, permitiendo una localización más precisa.
Optimización de Trayectorias
La optimización de trayectorias calcula la mejor ruta posible para que el vehículo la tome, generalmente basada en el mapa de la pista. El objetivo es encontrar el camino que permita al coche mantener la mayor velocidad mientras navega de manera segura las curvas.
MPC)
Control Predictivo de Modelos (Los enfoques de MPC ajustan continuamente las entradas de control basándose en predicciones del comportamiento del vehículo. Este método asegura que el coche se mantenga en la pista mientras se adapta dinámicamente a las condiciones cambiantes por delante.
Método de Seguir el Espacio
El método de seguir el espacio es una estrategia más simple y reactiva que guía al vehículo hacia el espacio más cercano en el entorno. No requiere un mapa, lo que lo convierte en una opción más flexible, pero a menudo menos eficiente que los enfoques planificados.
Aprendizaje de Extremo a Extremo
El aprendizaje de extremo a extremo implica entrenar una red neuronal para procesar datos de sensores y emitir las acciones necesarias para conducir. Este enfoque puede generalizarse bien a nuevas pistas, pero a menudo tiene dificultades a mayores velocidades debido a la complejidad de la toma de decisiones necesaria.
Evaluación de Puntos de Referencia y Resultados
Para evaluar la efectividad de los diferentes métodos, realizamos evaluaciones de puntos de referencia. Esto incluye probar tiempos de vuelta, analizar qué tan bien se desempeñó cada método y observar patrones en su operación.
Error de Localización
Un factor crítico que afecta el rendimiento es el error de localización. Estudiamos cómo los errores de estimación pueden impactar los tiempos de vuelta comparando resultados de la posición real del vehículo con aquellos usando posiciones estimadas. Los hallazgos muestran que una localización más precisa lleva a mejores tiempos de vuelta, destacando la importancia de métodos de localización efectivos.
Configuración de Entrenamiento
En el entrenamiento de varios agentes de aprendizaje, comparamos diferentes señales de recompensa para ver cómo afectan el rendimiento. Los resultados revelan que algunas recompensas llevan a un aprendizaje más rápido y mejores tasas de finalización durante las pruebas.
Resultados de Puntos de Referencia
Las evaluaciones generales muestran que los planificadores clásicos, basados en optimización, logran los tiempos de vuelta más rápidos. También demuestran la importancia de la gestión de la velocidad y cómo un comportamiento de dirección matizado puede llevar a mejores resultados en las carreras. En contraste, los métodos basados en aprendizaje, aunque ofrecen flexibilidad, a menudo se quedan atrás en eficiencia de tiempo.
Direcciones Futuras
Carreras Basadas en Visión
Mientras que muchos métodos actuales dependen de sensores LiDAR, hay potencial para usar cámaras como entrada principal. Este cambio podría llevar a sistemas más asequibles y versátiles para aplicaciones del mundo real.
Carreras de Pilas Completa
Se necesita más investigación sobre cómo diferentes secciones del pipeline de carreras afectan el rendimiento general. Abordar la interacción entre varios métodos puede llevar a soluciones más integradas y efectivas.
Robustez del Aprendizaje de Extremo a Extremo
Mejorar la robustez del aprendizaje de extremo a extremo es vital. Las soluciones actuales han mostrado inconsistencias, particularmente cuando enfrentan desafíos del mundo real, lo que limita su aplicación.
Transferencia de Simulación a Realidad
La brecha entre la simulación y el rendimiento en el mundo real debería ser reducida. Este enfoque es particularmente crucial para los enfoques de aprendizaje automático, muchos de los cuales solo se han probado en entornos controlados.
Soluciones Sin Mapa
Encontrar formas para que los vehículos operen efectivamente sin mapas predefinidos es esencial para la adaptabilidad. Investigar soluciones sin mapa puede llevar a aplicaciones más amplias en varios sistemas autónomos.
Carreras Multi-Agente
El objetivo final de las carreras no es solo el rendimiento individual, sino la competencia contra múltiples vehículos. Esto introduce complejidad en estrategias de adelantamiento y evasión, requiriendo una mezcla de enfoques clásicos y de aprendizaje.
Conclusión
Las carreras autónomas F1TENTH sirven como un prometedor banco de pruebas para avanzar en tecnologías en robótica y sistemas de conducción autónoma. La amplia variedad de métodos disponibles presenta tanto desafíos como oportunidades para la investigación. Al proporcionar una perspectiva unificada sobre el campo, esperamos fomentar la colaboración, facilitar comparaciones e inspirar futuras innovaciones en las carreras autónomas.
Título: Unifying F1TENTH Autonomous Racing: Survey, Methods and Benchmarks
Resumen: The F1TENTH autonomous driving platform, consisting of 1:10-scale remote-controlled cars, has evolved into a well-established education and research platform. The many publications and real-world competitions span many domains, from classical path planning to novel learning-based algorithms. Consequently, the field is wide and disjointed, hindering direct comparison of developed methods and making it difficult to assess the state-of-the-art. Therefore, we aim to unify the field by surveying current approaches, describing common methods, and providing benchmark results to facilitate clear comparisons and establish a baseline for future work. This research aims to survey past and current work with F1TENTH vehicles in the classical and learning categories and explain the different solution approaches. We describe particle filter localisation, trajectory optimisation and tracking, model predictive contouring control, follow-the-gap, and end-to-end reinforcement learning. We provide an open-source evaluation of benchmark methods and investigate overlooked factors of control frequency and localisation accuracy for classical methods as well as reward signal and training map for learning methods. The evaluation shows that the optimisation and tracking method achieves the fastest lap times, followed by the online planning approach. Finally, our work identifies and outlines the relevant research aspects to help motivate future work in the F1TENTH domain.
Autores: Benjamin David Evans, Raphael Trumpp, Marco Caccamo, Felix Jahncke, Johannes Betz, Hendrik Willem Jordaan, Herman Arnold Engelbrecht
Última actualización: 2024-04-25 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2402.18558
Fuente PDF: https://arxiv.org/pdf/2402.18558
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.