Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Robotica# Visione artificiale e riconoscimento di modelli

Progressi nell'imaging subacqueo e nella navigazione

Nuovi set di dati migliorano chiarezza e precisione per le immagini subacquee.

― 6 leggere min


Avanzamenti nel datasetAvanzamenti nel datasetdi imaging subacqueodelle immagini.navigazione subacquea e la precisioneNuovi set di dati migliorano la
Indice

La visione subacquea può essere davvero complicata. Man mano che si scende più in profondità o ci si allontana da un oggetto, la chiarezza di ciò che si vede può svanire. Questo rende compiti come l'identificazione di ostacoli o la mappatura di aree sott'acqua particolarmente difficili. Per aiutare con queste sfide, abbiamo creato due tipi di dataset che si concentrano sui sistemi di telecamere che guardano in avanti. Questi sistemi utilizzano telecamere speciali montate in modi diversi, catturando immagini e dati da luoghi subacquei come il Mediterraneo e il Mar Rosso.

I Dataset

Abbiamo messo insieme due tipi di dataset: uno con immagini stereo (due telecamere che lavorano insieme) e un altro che combina una singola telecamera con sensori di movimento (IMU). Questi dataset includono migliaia di immagini raccolte in diverse condizioni subacquee, featuring strutture sia naturali che artificiali. Ogni dataset è stato calibrato in modo da poter creare mappe di profondità, essenziali per misurare accuratamente le distanze sott'acqua.

Dataset Stereo

I dataset stereo consistono in immagini scattate da due telecamere contemporaneamente. Questa configurazione ci consente di catturare la stessa scena da angolazioni leggermente diverse, aiutandoci a stimare la profondità. Abbiamo posizionato oggetti di dimensioni conosciute nella scena per aiutare a convalidare le misurazioni. In totale, ci sono cinque dataset stereo, ciascuno che cattura immagini a una frequenza di 10 fotogrammi al secondo.

Dataset Visivo-Inerziali

I dataset visivo-inerziali utilizzano una singola telecamera abbinata a sensori di movimento per raccogliere dati. Questa configurazione consente al veicolo di vedere quello che ha di fronte mentre tiene traccia dei suoi movimenti. Ci sono otto dataset visivo-inerziali, registrati anch'essi a 10 fotogrammi al secondo. Simile ai dataset stereo, sono stati utilizzati oggetti di dimensioni conosciute per garantire l'accuratezza.

Perché Sono Importanti Questi Dataset?

Questi dataset possono essere utilizzati per migliorare diverse tecnologie subacquee. Possono aiutare a sviluppare sistemi per veicoli autonomi che possono navigare senza input umano, scoprire ostacoli e creare mappe dettagliate di aree subacquee. Questi progressi sono cruciali, soprattutto in ambienti di acque poco profonde dove i metodi tradizionali potrebbero non funzionare efficacemente.

Sfide nell’Imaging Subacqueo

Ottenere immagini chiare sott'acqua non è facile. La luce si comporta in modo diverso in acqua, spesso risultando in immagini che mancano di contrasto e dettaglio. Nel tempo, molti ricercatori hanno lavorato su modi per utilizzare le telecamere in modo efficace sott'acqua, ma ci sono ancora molti ostacoli da superare. Problemi come la diffusione della luce e il modo in cui la telecamera si muove attraverso l'acqua possono rendere difficile ottenere risultati accurati. A causa di queste sfide, abbiamo bisogno di dataset che riflettano accuratamente l'ambiente subacqueo.

Attenuazione della Luce

Quando la luce viaggia attraverso l'acqua, diventa più debole e può disperdersi, rendendo le immagini sfocate o sbiadite. Questo problema peggiora man mano che aumenta la distanza tra la telecamera e l'oggetto. Per i nostri dataset, ci siamo assicurati di catturare immagini in varie condizioni di luce così da poter capire meglio come affrontare questi problemi.

Movimento e Visibilità

Quando si catturano immagini sott'acqua, il modo in cui si muove la telecamera è cruciale. Movimenti rapidi possono introdurre sfocature, mentre movimenti lenti possono permettere immagini più chiare. I nostri dataset includono diversi tipi di movimenti della telecamera per aiutare a studiare come questi fattori influenzano la qualità dell'immagine.

Tipi di Algoritmi per Compiti Subacquei

Nel mondo della visione artificiale, sono stati sviluppati diversi algoritmi per affrontare le sfide del lavoro con le immagini. Alcune di queste tecniche sono state adattate per l'uso subacqueo, anche se quest'area ha ancora bisogno di più attenzione.

Struttura da Movimento (SfM)

SFM è un metodo che prende più immagini da angolazioni diverse e le usa per creare un modello tridimensionale dell'ambiente. Anche se questo può funzionare bene sulla terraferma, le condizioni subacquee possono introdurre sfide che influenzano la qualità dell'output.

Localizzazione e Mappatura Simultanea (SLAM)

SLAM è un altro metodo che aiuta i veicoli a navigare costruendo una mappa mentre traccia la loro posizione in tempo reale. Questa tecnologia è utile in aree dove i segnali GPS sono deboli o non disponibili, come sott'acqua. Integrare SLAM con dati visivo-inerziali può migliorare significativamente le prestazioni dei veicoli subacquei.

Odometria Visivo-Inerziale (VIO)

VIO combina dati da telecamera regolare con sensori di movimento per fornire una migliore consapevolezza spaziale. Può offrire misurazioni di profondità più accurate rispetto ai sistemi a telecamera tradizionale da soli. Questo è particolarmente utile per i veicoli subacquei che hanno bisogno di capacità di navigazione dettagliate.

Metodi di Raccolta Dati

Raccogliere dati sott'acqua richiede attenta pianificazione ed esecuzione. I nostri dataset sono stati raccolti utilizzando un paio di metodi diversi a seconda del tipo di configurazione di imaging.

Metodo di Raccolta Stereo

Per i dataset stereo, abbiamo utilizzato due telecamere impostate in modo da catturare immagini sincronizzate. Ci siamo assicurati che le telecamere fossero correttamente calibrate e impostate per raccogliere immagini a una velocità costante. È stata prestata particolare attenzione a tornare sui luoghi chiave per coerenza.

Metodo di Raccolta Visivo-Inerziale

Per i dataset visivo-inerziali, abbiamo utilizzato un ROV (Veicolo Operato a Distanza) per raccogliere immagini. Il subacqueo controllava il ROV, concentrandosi su un percorso fluido mentre si assicurava che le impostazioni della telecamera fossero ottimali per catturare immagini di qualità. Abbiamo incluso oggetti di dimensioni conosciute per aiutare nella scalatura delle mappe di profondità.

Generazione della Verità Fondamentale

Per confermare l'accuratezza dei nostri dataset, abbiamo creato mappe di profondità di verità fondamentale utilizzando software progettato per la fotogrammetria. Questo software prende le immagini raccolte e le usa per stimare distanze e posizioni nell'ambiente subacqueo. Verificando le misurazioni contro oggetti noti nella scena, ci assicuriamo che i nostri dataset siano affidabili.

Problemi Noti

Anche se abbiamo fatto grandi progressi nella raccolta di questi dataset, esistono ancora alcune sfide. Ad esempio, alcune immagini potrebbero essere sovraesposte durante il passaggio tra diverse condizioni di illuminazione. Inoltre, la mancanza di sincronizzazione tra la telecamera e il sensore di movimento può influenzare la qualità dei dati.

Conclusione

I nostri dataset subacquei a visione anteriore forniscono una risorsa preziosa per ricercatori e sviluppatori che lavorano su sistemi autonomi subacquei. Con dati stereo e visivo-inerziali dettagliati, speriamo di incoraggiare progressi nelle tecnologie di navigazione e imaging subacquee. Avere accesso a questo tipo di informazioni è cruciale per affrontare le uniche sfide presentate dagli ambienti subacquei, consentendo ai sistemi di operare in modo più efficace in condizioni complesse. Crediamo che i nostri dataset serviranno da punto di riferimento per chiunque desideri migliorare la propria comprensione dell'imaging subacqueo e della robotica.

Fonte originale

Titolo: FLSea: Underwater Visual-Inertial and Stereo-Vision Forward-Looking Datasets

Estratto: Visibility underwater is challenging, and degrades as the distance between the subject and camera increases, making vision tasks in the forward-looking direction more difficult. We have collected underwater forward-looking stereo-vision and visual-inertial image sets in the Mediterranean and Red Sea. To our knowledge there are no other public datasets in the underwater environment acquired with this camera-sensor orientation published with ground-truth. These datasets are critical for the development of several underwater applications, including obstacle avoidance, visual odometry, 3D tracking, Simultaneous Localization and Mapping (SLAM) and depth estimation. The stereo datasets include synchronized stereo images in dynamic underwater environments with objects of known-size. The visual-inertial datasets contain monocular images and IMU measurements, aligned with millisecond resolution timestamps and objects of known size which were placed in the scene. Both sensor configurations allow for scale estimation, with the calibrated baseline in the stereo setup and the IMU in the visual-inertial setup. Ground truth depth maps were created offline for both dataset types using photogrammetry. The ground truth is validated with multiple known measurements placed throughout the imaged environment. There are 5 stereo and 8 visual-inertial datasets in total, each containing thousands of images, with a range of different underwater visibility and ambient light conditions, natural and man-made structures and dynamic camera motions. The forward-looking orientation of the camera makes these datasets unique and ideal for testing underwater obstacle-avoidance algorithms and for navigation close to the seafloor in dynamic environments. With our datasets, we hope to encourage the advancement of autonomous functionality for underwater vehicles in dynamic and/or shallow water environments.

Autori: Yelena Randall, Tali Treibitz

Ultimo aggiornamento: 2023-02-24 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2302.12772

Fonte PDF: https://arxiv.org/pdf/2302.12772

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili