Optimizando la planificación del movimiento robótico en entornos complejos

Tabla de contenidos

Planificación de Movimiento en Terreno 2D
Navegación de Masa Puntual en una Cuadrícula de Obstáculos
Referencia de Planificación de Movimiento
Comparación de Referencias en Manipuladores Robóticos
Regularización de la Longitud del Camino y Movimientos Dinámicos
Colisión de Robot como Costo Continuo
Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración
Fuente original
Enlaces de referencia

En esta sección, mostramos resultados para probar que nuestro método funciona bien en varios experimentos simulados, desde la Planificación de movimientos 2D simples hasta tareas más complejas para brazos robóticos.

Planificación de Movimiento en Terreno 2D

Los primeros experimentos implican optimizar caminos en un paisaje 2D aleatorio. Lo ilustramos con una figura. En el paisaje, las áreas con alto costo, como colinas, se muestran en colores oscuros, y las áreas de bajo costo, como valles, están en colores más claros.

El paisaje se compone de varias distribuciones gaussianas multivariantes aleatorias dispuestas según una secuencia de Halton, formando un modelo de mezcla gaussiana. Los caminos se crean usando splines cúbicos naturales con un número fijo de puntos, aparte de los puntos de inicio y fin.

Nuestro objetivo es encontrar las mejores posiciones para estos puntos para crear caminos desde el punto de partida hasta el objetivo, evitando áreas de alto costo y sin ser demasiado largos. Para encontrar una solución óptima, desarrollamos una Función de Costo que equilibra la longitud del camino y la facilidad de movimiento.

Cada camino que creamos se muestrea en 100 puntos de referencia antes de verificar contra nuestra función de costo. Los puntos de inicio para estos puntos de referencia se establecen aleatoriamente, y los 20 caminos finales se muestran en la figura usando tres métodos de optimización diferentes.

Los caminos encontrados con el Método de Descenso por Gradiente por Lotes (BGD) muestran que convergen a dos soluciones principales con costos similares. Los resultados del otro método muestran más variedad, pero no lograron capturar una solución de BGD. Cuando varios caminos se unen en un área de bajo costo, los nudos se separan, lo que lleva a resultados menos óptimos. En contraste, los caminos de nuestro enfoque muestran más variedad y pueden coexistir en espacios reducidos, lo que lleva a caminos más directos que los del otro método.

Navegación de Masa Puntual en una Cuadrícula de Obstáculos

A continuación, vemos tareas de navegación de masa puntual. Comparamos el costo y los pasos dados por diferentes métodos en una tabla. Un método, CMA-ES, no logró terminar ninguna de las tareas, así que sus resultados no están incluidos.

Cuando graficamos los caminos de navegación, ilustramos un paso intermedio de la tarea de navegación usando dos métodos. Los colores en la gráfica indican el origen de cada camino, mientras que los patrones de movimiento estándar se muestran en púrpura. Los caminos creados por nuestro método son más variados, lo que ayuda en la actualización de las políticas.

Nuestro objetivo es mostrar las ventajas de aplicar un cierto tipo de control usando el control predictivo basado en el modelo (MPC) con kernel de firma. Para esto, simulamos un robot navegando de inicio a fin a través de una cuadrícula de obstáculos.

El movimiento del robot se modela con un sistema de doble integrador, donde podemos controlar su movimiento aplicando fuerza. Usamos la misma función de costo que en trabajos anteriores, que tiene en cuenta los errores de posición y penalizaciones por colisiones.

Referencia de Planificación de Movimiento

Nuestros resultados de referencia reflejan promedios tomados de varias ejecuciones sobre escenarios distintos. Mostramos medias y desviaciones estándar para varias solicitudes. Los mejores resultados se destacan, mostrando los costos más bajos para los caminos encontrados.

En este escenario controlado, organizamos obstáculos en una cuadrícula para crear múltiples caminos. El simulador verifica colisiones según el estado del robot y previene el movimiento si se detecta una colisión. Además, se colocan barreras para asegurar que el robot no rodee los obstáculos fácilmente.

Dado que la función de costo no es suave, necesitamos calcular gradientes aproximados a través de muestreo. En este experimento, cada camino es una representación de una política de control que se optimiza. Generamos gradientes verificando políticas y evaluando despliegues.

CMA-ES solo explora una solución a la vez. Para hacerlo comparable, aumentamos el número de muestras que chequea en cada paso. Este método también integra controles básicos predefinidos que no se modifican durante la optimización.

Los resultados muestran que nuestro método conduce a costos más bajos y menos pasos de tiempo para alcanzar objetivos en comparación con otros. La naturaleza del problema limita cuántas iteraciones podemos realizar, lo que hace que sea más desafiante para CMA-ES, que tuvo dificultades en todas las pruebas.

Comparación de Referencias en Manipuladores Robóticos

Probamos nuestro método usando tareas de manipulación robótica generadas a partir de un conjunto específico de escenarios. Cada escenario incluye obstáculos colocados aleatoriamente y consiste en mover el brazo robótico desde su posición inicial a una configuración objetivo.

Generamos múltiples solicitudes para cada escena, optimizando con varias semillas aleatorias para consistencia. El robot utilizado en este caso tiene siete juntas.

La función de costo asegura que los caminos sean suaves, seguros de colisiones y tengan un movimiento mínimo para el efector final del robot.

En planificación de movimiento, optimizamos directamente en el espacio articular, simplificando la búsqueda de movimientos posibles. Para producir movimientos suaves, creamos caminos usando splines cúbicos naturales con varios puntos intermedios entre el inicio y el final.

Regularización de la Longitud del Camino y Movimientos Dinámicos

Si bien usar splines ayuda a crear caminos suaves, no garantiza movimientos suaves para el robot. Por ejemplo, incluso si un camino parece suave, el robot aún puede moverse de manera torpe, lo que lleva a aceleraciones y desaceleraciones bruscas.

Para evitar estos movimientos repentinos, agregamos un nuevo término a la función de costo que desincentiva saltos grandes entre configuraciones del robot. Esto toma en cuenta la cantidad de puntos elegidos a lo largo del camino y le da más importancia a ciertas juntas.

También incluimos un término final en la función de costo que se centra en minimizar la longitud de la trayectoria del efector final. Nuestra función de costo total combina penalizaciones por longitud de camino, dinámica y colisiones.

El proceso de optimización continúa durante un total de 500 iteraciones, ajustando las fuerzas que actúan sobre los nudos para que los caminos puedan converger mejor. Los resultados reflejan un rendimiento mejorado en diversas condiciones.

Colisión de Robot como Costo Continuo

Típicamente, verificar colisiones es una respuesta sencilla de sí o no, lo que no se presta bien a la optimización. Para crear un proceso de verificación de colisiones más suave, utilizamos cuadrículas de ocupación continuas.

Estas cuadrículas representan áreas donde el robot opera como una cuadrícula de celdas, cada una representando si hay un obstáculo presente. Sin embargo, este método no es suave, así que desarrollamos una versión continua de estos mapas de ocupación.

Para hacer esto, empleamos una red neuronal que aprende a predecir si una configuración específica para el robot está ocupada o no. Esta red es rápida y puede proporcionar la información necesaria para ayudar con grandes lotes de coordenadas durante la planificación.

Para entrenar la red, tomamos puntos de datos de sensores y los categorizamos como ocupados o no. La red luego aprende a dar una probabilidad que funciona como una función de costo para la Detección de Colisiones.

Para verificar autocolisiones, seguimos un proceso similar, utilizando otra red neuronal para predecir la probabilidad de colisiones entre las juntas del robot. Entrenamos esta red usando configuraciones aleatorias y verificaciones existentes proporcionadas por la interfaz de programación del robot.

Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración

Es esencial vincular el espacio de trabajo con el movimiento del robot en el espacio articular. Asumimos que el movimiento del robot está definido en el espacio articular, y necesitamos extraer información de costo del espacio de trabajo a este espacio.

Las funciones de costo que diseñamos necesitan moldear cómo se comporta el robot. Definimos configuraciones articulares, que representan las posiciones de cada junta en el robot.

Comenzamos estableciendo puntos en el cuerpo del robot, cada uno conectado a su posición en el espacio de trabajo a través de una función específica. El siguiente paso implica calcular cómo el costo en el espacio de trabajo afecta el movimiento en el espacio articular.

Al extraer gradientes de costo del espacio de trabajo, podemos ajustar la trayectoria en el espacio articular basado en los costos potenciales encontrados en el espacio de trabajo. Este proceso ayuda a lograr movimientos más suaves y eficientes para el robot, evitando obstáculos.

El enfoque general detallado ayuda a mejorar el rendimiento del robot en diversas tareas, asegurando caminos más seguros y efectivos durante la operación. Las técnicas descritas facilitan no solo caminos suaves, sino también una mejor adaptabilidad a entornos dinámicos.

Optimizando la planificación del movimiento robótico en entornos complejos

La investigación muestra métodos mejorados para la planificación de movimiento robótico en varios escenarios complicados.

Planificación de Movimiento en Terreno 2D

Navegación de Masa Puntual en una Cuadrícula de Obstáculos

Referencia de Planificación de Movimiento

Comparación de Referencias en Manipuladores Robóticos

Regularización de la Longitud del Camino y Movimientos Dinámicos

Colisión de Robot como Costo Continuo

Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración

Enlaces de referencia

Temas referenciados

Optimizando la planificación del movimiento robótico en entornos complejos

La investigación muestra métodos mejorados para la planificación de movimiento robótico en varios escenarios complicados.

#Planificación de Movimiento en Terreno 2D

#Navegación de Masa Puntual en una Cuadrícula de Obstáculos

#Referencia de Planificación de Movimiento

#Comparación de Referencias en Manipuladores Robóticos

#Regularización de la Longitud del Camino y Movimientos Dinámicos

#Colisión de Robot como Costo Continuo

#Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración

Enlaces de referencia

Temas referenciados

Planificación de Movimiento en Terreno 2D

Navegación de Masa Puntual en una Cuadrícula de Obstáculos

Referencia de Planificación de Movimiento

Comparación de Referencias en Manipuladores Robóticos

Regularización de la Longitud del Camino y Movimientos Dinámicos

Colisión de Robot como Costo Continuo

Traer el Costo de Colisión del Espacio de Trabajo al Espacio de Configuración