Optimizando la planificación del movimiento robótico en entornos complejos
La investigación muestra métodos mejorados para la planificación de movimiento robótico en varios escenarios complicados.
― 8 minilectura
Tabla de contenidos
- Planificación de Movimiento en Terreno 2D
- Navegación de Masa Puntual en una Cuadrícula de Obstáculos
- Referencia de Planificación de Movimiento
- Comparación de Referencias en Manipuladores Robóticos
- Regularización de la Longitud del Camino y Movimientos Dinámicos
- Colisión de Robot como Costo Continuo
- Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración
- Fuente original
- Enlaces de referencia
En esta sección, mostramos resultados para probar que nuestro método funciona bien en varios experimentos simulados, desde la Planificación de movimientos 2D simples hasta tareas más complejas para brazos robóticos.
Planificación de Movimiento en Terreno 2D
Los primeros experimentos implican optimizar caminos en un paisaje 2D aleatorio. Lo ilustramos con una figura. En el paisaje, las áreas con alto costo, como colinas, se muestran en colores oscuros, y las áreas de bajo costo, como valles, están en colores más claros.
El paisaje se compone de varias distribuciones gaussianas multivariantes aleatorias dispuestas según una secuencia de Halton, formando un modelo de mezcla gaussiana. Los caminos se crean usando splines cúbicos naturales con un número fijo de puntos, aparte de los puntos de inicio y fin.
Nuestro objetivo es encontrar las mejores posiciones para estos puntos para crear caminos desde el punto de partida hasta el objetivo, evitando áreas de alto costo y sin ser demasiado largos. Para encontrar una solución óptima, desarrollamos una Función de Costo que equilibra la longitud del camino y la facilidad de movimiento.
Cada camino que creamos se muestrea en 100 puntos de referencia antes de verificar contra nuestra función de costo. Los puntos de inicio para estos puntos de referencia se establecen aleatoriamente, y los 20 caminos finales se muestran en la figura usando tres métodos de optimización diferentes.
Los caminos encontrados con el Método de Descenso por Gradiente por Lotes (BGD) muestran que convergen a dos soluciones principales con costos similares. Los resultados del otro método muestran más variedad, pero no lograron capturar una solución de BGD. Cuando varios caminos se unen en un área de bajo costo, los nudos se separan, lo que lleva a resultados menos óptimos. En contraste, los caminos de nuestro enfoque muestran más variedad y pueden coexistir en espacios reducidos, lo que lleva a caminos más directos que los del otro método.
Obstáculos
Navegación de Masa Puntual en una Cuadrícula deA continuación, vemos tareas de navegación de masa puntual. Comparamos el costo y los pasos dados por diferentes métodos en una tabla. Un método, CMA-ES, no logró terminar ninguna de las tareas, así que sus resultados no están incluidos.
Cuando graficamos los caminos de navegación, ilustramos un paso intermedio de la tarea de navegación usando dos métodos. Los colores en la gráfica indican el origen de cada camino, mientras que los patrones de movimiento estándar se muestran en púrpura. Los caminos creados por nuestro método son más variados, lo que ayuda en la actualización de las políticas.
Nuestro objetivo es mostrar las ventajas de aplicar un cierto tipo de control usando el control predictivo basado en el modelo (MPC) con kernel de firma. Para esto, simulamos un robot navegando de inicio a fin a través de una cuadrícula de obstáculos.
El movimiento del robot se modela con un sistema de doble integrador, donde podemos controlar su movimiento aplicando fuerza. Usamos la misma función de costo que en trabajos anteriores, que tiene en cuenta los errores de posición y penalizaciones por colisiones.
Referencia de Planificación de Movimiento
Nuestros resultados de referencia reflejan promedios tomados de varias ejecuciones sobre escenarios distintos. Mostramos medias y desviaciones estándar para varias solicitudes. Los mejores resultados se destacan, mostrando los costos más bajos para los caminos encontrados.
En este escenario controlado, organizamos obstáculos en una cuadrícula para crear múltiples caminos. El simulador verifica colisiones según el estado del robot y previene el movimiento si se detecta una colisión. Además, se colocan barreras para asegurar que el robot no rodee los obstáculos fácilmente.
Dado que la función de costo no es suave, necesitamos calcular gradientes aproximados a través de muestreo. En este experimento, cada camino es una representación de una política de control que se optimiza. Generamos gradientes verificando políticas y evaluando despliegues.
CMA-ES solo explora una solución a la vez. Para hacerlo comparable, aumentamos el número de muestras que chequea en cada paso. Este método también integra controles básicos predefinidos que no se modifican durante la optimización.
Los resultados muestran que nuestro método conduce a costos más bajos y menos pasos de tiempo para alcanzar objetivos en comparación con otros. La naturaleza del problema limita cuántas iteraciones podemos realizar, lo que hace que sea más desafiante para CMA-ES, que tuvo dificultades en todas las pruebas.
Comparación de Referencias en Manipuladores Robóticos
Probamos nuestro método usando tareas de manipulación robótica generadas a partir de un conjunto específico de escenarios. Cada escenario incluye obstáculos colocados aleatoriamente y consiste en mover el brazo robótico desde su posición inicial a una configuración objetivo.
Generamos múltiples solicitudes para cada escena, optimizando con varias semillas aleatorias para consistencia. El robot utilizado en este caso tiene siete juntas.
La función de costo asegura que los caminos sean suaves, seguros de colisiones y tengan un movimiento mínimo para el efector final del robot.
En planificación de movimiento, optimizamos directamente en el espacio articular, simplificando la búsqueda de movimientos posibles. Para producir movimientos suaves, creamos caminos usando splines cúbicos naturales con varios puntos intermedios entre el inicio y el final.
Regularización de la Longitud del Camino y Movimientos Dinámicos
Si bien usar splines ayuda a crear caminos suaves, no garantiza movimientos suaves para el robot. Por ejemplo, incluso si un camino parece suave, el robot aún puede moverse de manera torpe, lo que lleva a aceleraciones y desaceleraciones bruscas.
Para evitar estos movimientos repentinos, agregamos un nuevo término a la función de costo que desincentiva saltos grandes entre configuraciones del robot. Esto toma en cuenta la cantidad de puntos elegidos a lo largo del camino y le da más importancia a ciertas juntas.
También incluimos un término final en la función de costo que se centra en minimizar la longitud de la trayectoria del efector final. Nuestra función de costo total combina penalizaciones por longitud de camino, dinámica y colisiones.
El proceso de optimización continúa durante un total de 500 iteraciones, ajustando las fuerzas que actúan sobre los nudos para que los caminos puedan converger mejor. Los resultados reflejan un rendimiento mejorado en diversas condiciones.
Colisión de Robot como Costo Continuo
Típicamente, verificar colisiones es una respuesta sencilla de sí o no, lo que no se presta bien a la optimización. Para crear un proceso de verificación de colisiones más suave, utilizamos cuadrículas de ocupación continuas.
Estas cuadrículas representan áreas donde el robot opera como una cuadrícula de celdas, cada una representando si hay un obstáculo presente. Sin embargo, este método no es suave, así que desarrollamos una versión continua de estos mapas de ocupación.
Para hacer esto, empleamos una red neuronal que aprende a predecir si una configuración específica para el robot está ocupada o no. Esta red es rápida y puede proporcionar la información necesaria para ayudar con grandes lotes de coordenadas durante la planificación.
Para entrenar la red, tomamos puntos de datos de sensores y los categorizamos como ocupados o no. La red luego aprende a dar una probabilidad que funciona como una función de costo para la Detección de Colisiones.
Para verificar autocolisiones, seguimos un proceso similar, utilizando otra red neuronal para predecir la probabilidad de colisiones entre las juntas del robot. Entrenamos esta red usando configuraciones aleatorias y verificaciones existentes proporcionadas por la interfaz de programación del robot.
Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración
Es esencial vincular el espacio de trabajo con el movimiento del robot en el espacio articular. Asumimos que el movimiento del robot está definido en el espacio articular, y necesitamos extraer información de costo del espacio de trabajo a este espacio.
Las funciones de costo que diseñamos necesitan moldear cómo se comporta el robot. Definimos configuraciones articulares, que representan las posiciones de cada junta en el robot.
Comenzamos estableciendo puntos en el cuerpo del robot, cada uno conectado a su posición en el espacio de trabajo a través de una función específica. El siguiente paso implica calcular cómo el costo en el espacio de trabajo afecta el movimiento en el espacio articular.
Al extraer gradientes de costo del espacio de trabajo, podemos ajustar la trayectoria en el espacio articular basado en los costos potenciales encontrados en el espacio de trabajo. Este proceso ayuda a lograr movimientos más suaves y eficientes para el robot, evitando obstáculos.
El enfoque general detallado ayuda a mejorar el rendimiento del robot en diversas tareas, asegurando caminos más seguros y efectivos durante la operación. Las técnicas descritas facilitan no solo caminos suaves, sino también una mejor adaptabilidad a entornos dinámicos.
Título: Path Signatures for Diversity in Probabilistic Trajectory Optimisation
Resumen: Motion planning can be cast as a trajectory optimisation problem where a cost is minimised as a function of the trajectory being generated. In complex environments with several obstacles and complicated geometry, this optimisation problem is usually difficult to solve and prone to local minima. However, recent advancements in computing hardware allow for parallel trajectory optimisation where multiple solutions are obtained simultaneously, each initialised from a different starting point. Unfortunately, without a strategy preventing two solutions to collapse on each other, naive parallel optimisation can suffer from mode collapse diminishing the efficiency of the approach and the likelihood of finding a global solution. In this paper we leverage on recent advances in the theory of rough paths to devise an algorithm for parallel trajectory optimisation that promotes diversity over the range of solutions, therefore avoiding mode collapses and achieving better global properties. Our approach builds on path signatures and Hilbert space representations of trajectories, and connects parallel variational inference for trajectory estimation with diversity promoting kernels. We empirically demonstrate that this strategy achieves lower average costs than competing alternatives on a range of problems, from 2D navigation to robotic manipulators operating in cluttered environments.
Autores: Lucas Barcelos, Tin Lai, Rafael Oliveira, Paulo Borges, Fabio Ramos
Última actualización: 2023-08-08 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2308.04071
Fuente PDF: https://arxiv.org/pdf/2308.04071
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.