Avances en Imágenes y Navegación Submarina
Nuevos conjuntos de datos mejoran la claridad y precisión de los visuales submarinos.
― 7 minilectura
Tabla de contenidos
La visión submarina puede ser bastante complicada. A medida que te adentras más o te alejas de un objeto, la claridad de lo que ves puede disminuir. Esto hace que tareas como identificar obstáculos o mapear áreas bajo el agua sean particularmente difíciles. Para ayudar con estos desafíos, hemos creado dos tipos de conjuntos de datos que se enfocan en sistemas de cámaras con visión hacia adelante. Estos sistemas utilizan cámaras especiales configuradas de diferentes maneras, capturando imágenes y datos de lugares submarinos como el Mediterráneo y el Mar Rojo.
Los Conjuntos de Datos
Hemos reunido dos tipos de conjuntos de datos: uno con imágenes estéreo (dos cámaras trabajando juntas) y otro que combina una sola cámara con sensores de movimiento (IMU). Estos conjuntos de datos incluyen miles de imágenes recolectadas en diferentes condiciones submarinas, mostrando tanto estructuras naturales como hechas por el hombre. Cada conjunto de datos ha sido calibrado para que podamos crear mapas de profundidad, que son esenciales para medir distancias bajo el agua de forma precisa.
Conjuntos de Datos Estéreo
Los conjuntos de datos estéreo consisten en imágenes tomadas por dos cámaras al mismo tiempo. Esta configuración nos permite capturar la misma escena desde ángulos ligeramente diferentes, ayudándonos a estimar la profundidad. Hemos colocado objetos de tamaño conocido en la escena para validar las mediciones. En total, hay cinco conjuntos de datos estéreo, cada uno capturando imágenes a una tasa de 10 cuadros por segundo.
Conjuntos de Datos Visual-Inercial
Los conjuntos de datos visual-inerciales utilizan una sola cámara emparejada con sensores de movimiento para recoger datos. Esta configuración permite que el vehículo vea lo que está directamente adelante, mientras también mantiene un registro de sus movimientos. Hay ocho conjuntos de datos visual-inerciales, también grabados a 10 cuadros por segundo. Al igual que con los conjuntos de datos estéreo, se usaron objetos de tamaño conocido para ayudar a asegurar la precisión.
¿Por Qué Son Importantes Estos Conjuntos de Datos?
Estos conjuntos de datos pueden ser utilizados para mejorar varias tecnologías submarinas. Pueden ayudar a desarrollar sistemas para vehículos autónomos que pueden navegar sin intervención humana, descubrir obstáculos y crear mapas detallados de áreas submarinas. Estos avances son cruciales, especialmente en entornos de aguas poco profundas donde los métodos tradicionales pueden no funcionar de manera efectiva.
Desafíos en la Imágenes Submarinas
Obtener imágenes claras bajo el agua no es fácil. La luz se comporta de manera diferente en el agua, lo que a menudo resulta en imágenes que carecen de contraste y detalle. A lo largo del tiempo, muchos investigadores han trabajado en formas de usar cámaras de manera efectiva bajo el agua, pero aún hay muchos obstáculos por superar. Problemas como la dispersión de la luz y cómo la cámara se mueve a través del agua pueden dificultar la obtención de resultados precisos. Debido a estos desafíos, necesitamos conjuntos de datos que reflejen con precisión el entorno submarino.
Atenuación de Luz
Cuando la luz viaja a través del agua, se debilita y puede dispersarse, haciendo que las imágenes se vean borrosas o lavadas. Este problema se agrava a medida que aumenta la distancia entre la cámara y el objeto. Para nuestros conjuntos de datos, nos hemos asegurado de capturar imágenes en diversas condiciones de luz para entender mejor cómo lidiar con estos problemas.
Movimiento y Visibilidad
Al capturar imágenes bajo el agua, la forma en que se mueve la cámara es crucial. Los movimientos rápidos pueden introducir borrosidad, mientras que los movimientos lentos pueden permitir imágenes más claras. Nuestros conjuntos de datos incluyen diferentes tipos de movimientos de cámara para ayudar a estudiar cómo estos factores afectan la calidad de la imagen.
Tipos de Algoritmos para Tareas Submarinas
En el mundo de la visión por computadora, se han desarrollado varios algoritmos para manejar los desafíos de trabajar con imágenes. Algunas de estas técnicas se han adaptado para su uso submarino, aunque esta área aún necesita más atención.
Estructura a partir del movimiento (SfM)
El SFM es un método que toma múltiples imágenes desde diferentes ángulos y las usa para crear un modelo tridimensional del entorno. Aunque esto puede funcionar bien en tierra, las condiciones submarinas pueden presentar desafíos que afectan la calidad de la salida.
Localización y Mapeo Simultáneos (SLAM)
El SLAM es otro método que ayuda a los vehículos a navegar construyendo un mapa mientras rastrea su ubicación en tiempo real. Esta tecnología es útil en áreas donde las señales de GPS son débiles o están ausentes, como debajo del agua. Integrar el SLAM con datos visual-inerciales puede mejorar significativamente el rendimiento de los vehículos submarinos.
Odometría Visual-Inercial (VIO)
El VIO combina datos de cámaras normales con sensores de movimiento para proporcionar una mejor conciencia espacial. Puede ofrecer mediciones de profundidad más precisas en comparación con los sistemas de cámaras tradicionales por sí solos. Esto es particularmente útil para vehículos submarinos que necesitan capacidades de navegación detalladas.
Métodos de Recolección de Datos
Recolectar datos bajo el agua requiere planificación y ejecución cuidadosas. Nuestros conjuntos de datos se recopilaron utilizando un par de métodos diferentes dependiendo del tipo de configuración de imagen.
Método de Recolección Estéreo
Para los conjuntos de datos estéreo, utilizamos dos cámaras configuradas de tal manera que puedan capturar imágenes sincronizadas. Nos aseguramos de que las cámaras estuvieran debidamente calibradas y configuradas para recolectar imágenes a una tasa constante. Se prestó especial atención a volver a visitar ubicaciones clave para consistencia.
Método de Recolección Visual-Inercial
Para los conjuntos de datos visual-inerciales, utilizamos un ROV (Vehículo Operado Remotamente) para recoger imágenes. El buzo controlaba el ROV, enfocándose en un camino suave mientras aseguraba que la configuración de la cámara fuera óptima para capturar imágenes de calidad. Incluimos objetos de tamaño conocido para ayudar a escalar los mapas de profundidad.
Generación de Verdad Fundamental
Para confirmar la precisión de nuestros conjuntos de datos, creamos mapas de profundidad de verdad fundamental utilizando software diseñado para fotogrametría. Este software toma las imágenes recolectadas y las utiliza para estimar distancias y posiciones en el entorno submarino. Al verificar las mediciones contra objetos conocidos en la escena, aseguramos que nuestros conjuntos de datos sean confiables.
Problemas Conocidos
Aunque hemos logrado grandes avances en la recolección de estos conjuntos de datos, aún existen algunos desafíos. Por ejemplo, algunas imágenes pueden estar sobreexpuestas al cambiar entre diferentes condiciones de iluminación. Además, la falta de sincronización entre la cámara y el sensor de movimiento puede afectar la calidad de los datos.
Conclusión
Nuestros conjuntos de datos submarinos con visión hacia adelante proporcionan un recurso valioso para investigadores y desarrolladores que trabajan en sistemas submarinos autónomos. Con datos estéreo y visual-inerciales detallados, esperamos fomentar avances en tecnologías de navegación e imágenes submarinas. El acceso a este tipo de información es crucial para abordar los desafíos únicos que presentan los entornos submarinos, permitiendo que los sistemas operen de manera más efectiva en condiciones complejas. Creemos que nuestros conjuntos de datos servirán como un estándar para cualquiera que busque mejorar su comprensión de la imagen submarina y la robótica.
Título: FLSea: Underwater Visual-Inertial and Stereo-Vision Forward-Looking Datasets
Resumen: Visibility underwater is challenging, and degrades as the distance between the subject and camera increases, making vision tasks in the forward-looking direction more difficult. We have collected underwater forward-looking stereo-vision and visual-inertial image sets in the Mediterranean and Red Sea. To our knowledge there are no other public datasets in the underwater environment acquired with this camera-sensor orientation published with ground-truth. These datasets are critical for the development of several underwater applications, including obstacle avoidance, visual odometry, 3D tracking, Simultaneous Localization and Mapping (SLAM) and depth estimation. The stereo datasets include synchronized stereo images in dynamic underwater environments with objects of known-size. The visual-inertial datasets contain monocular images and IMU measurements, aligned with millisecond resolution timestamps and objects of known size which were placed in the scene. Both sensor configurations allow for scale estimation, with the calibrated baseline in the stereo setup and the IMU in the visual-inertial setup. Ground truth depth maps were created offline for both dataset types using photogrammetry. The ground truth is validated with multiple known measurements placed throughout the imaged environment. There are 5 stereo and 8 visual-inertial datasets in total, each containing thousands of images, with a range of different underwater visibility and ambient light conditions, natural and man-made structures and dynamic camera motions. The forward-looking orientation of the camera makes these datasets unique and ideal for testing underwater obstacle-avoidance algorithms and for navigation close to the seafloor in dynamic environments. With our datasets, we hope to encourage the advancement of autonomous functionality for underwater vehicles in dynamic and/or shallow water environments.
Autores: Yelena Randall, Tali Treibitz
Última actualización: 2023-02-24 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2302.12772
Fuente PDF: https://arxiv.org/pdf/2302.12772
Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.